Вопросы по теме 'stringr'
лучший способ манипулировать строками в больших данных. таблица
У меня есть строка data.table размером 67 мм с именами и фамилиями людей, разделенными пробелами. Мне просто нужно создать новый столбец для каждого слова.
Вот небольшое подмножество данных:
n <- structure(list(Subscription_Id =...
706 просмотров
schedule
02.01.2024
Определите постоянно встречающееся растяжение определенных букв в строке с помощью R
Я хотел бы определить, повторяет ли столбец строки в приведенном ниже фрейме данных буквы «V» или «G» не менее 5 раз в пределах первых 20 символов строки.
Пример данных:
data = data.frame(class = c('a','b','C'), string =...
231 просмотров
schedule
26.04.2024
Почему в этом регулярном выражении отсутствует один пробел между двумя цифрами?
Я пытаюсь найти в строке один пробел, окруженный цифрой с каждой стороны. Я построил следующий пример:
library('stringr')
str1 <- "1805.6 1-1 1"
str_locate_all(str1, "\\s+")[[1]]
str_locate_all(str1, "[[:digit:]]\\s[[:digit:]]")[[1]]
Что...
81 просмотров
schedule
14.11.2022
Удаление нескольких символов из строки с помощью Stringr
Я новичок в работе со строками в R. Ниже приведен простой фрейм данных с множеством различных входных данных для телефонных номеров, включая некоторые записи вообще без номеров, а только скобки или дефисы. Я ищу способ преобразовать все числа в...
739 просмотров
schedule
05.02.2024
Регулярное выражение R извлекает похожие слова, но у одного есть дефис
У меня есть следующий фрейм данных:
species size_description
1 "some text Small some text"
2 "some text small-med some text"
3 "some text Med. some text"
4 "some text medium some text"
5 "some text...
161 просмотров
schedule
05.11.2022
stringr: извлечь слова, содержащие определенное слово
Рассмотрим этот простой пример
dataframe <- data_frame(text = c('WAFF;WOFF;WIFF200;WIFF12',
'WUFF;WEFF;WIFF2;BIGWIFF'))
> dataframe
# A tibble: 2 x 1
text...
3057 просмотров
schedule
23.04.2024
R: простое обнаружение ключевых слов
Я хочу проверить, отображается ли любое из набора "ключевых слов" в строке. Таким образом, для «текст» ниже результат должен быть ИСТИНА (или 1), а для text_2 - ЛОЖЬ (или 0).
keywords <- c("one", "two", "three", "four") #set of keywords...
109 просмотров
schedule
17.01.2024
Цикл для извлечения переменной из каждого документа и размещения в соответствующем столбце
Моя компания документирует резюме политик/услуг для каждого клиента в файле в формате pdf. Эти файлы ежегодно объединяются в большой набор данных. Одна строка на клиента и столбцы являются переменными в документе клиента. Этих файлов пара тысяч и в...
63 просмотров
schedule
17.11.2023
переименование всех столбцов фрейма данных с помощью stringr и dplyr
Я пытаюсь переименовать все столбцы в моем фрейме данных, используя dplyr и stringr , но, похоже, он работает не так, как я хочу. Что мне следует изменить в следующем коде, чтобы получить желаемый результат (как показано в приведенном ниже коде)?...
1750 просмотров
schedule
11.11.2023
Поиск строки имени столбца и возврат логических данных для ряда столбцов (R)
Пример данных:
example <- data.frame(matrix(NA, ncol=4, nrow=4))
names(example) <- c("reason_code", "d_01", "d_02", "d_03")
example$reason_code <- c("d_01, d_03", "d_01", "d_02", "d_02, d_03")
Предоставление:
reason_code d_01...
506 просмотров
schedule
27.05.2024
Извлечение элементов из текстовых файлов в R
Я пытаюсь заняться анализом текста в R. У меня есть текстовый файл со следующей структурой.
HD A YEAR Oxxxx
WC 244 words
PD 28 February 2018
SN XYZ
SC hydt
LA English
CY Copyright 2018
LP Rio de Janeiro, Feb 28
TD
With recreational...
63 просмотров
schedule
09.04.2024
Используйте извлечение и/или разделение, чтобы изолировать переменную строку от фрейма данных
Я просмотрел следующие страницы по использованию регулярного выражения для изоляции строки:
Регулярное выражение для извлечения текста между квадратными скобками
Что такое группа без захвата? Что делает (?:)?
Разделить столбец строки...
218 просмотров
schedule
03.12.2022
Подсчитать максимальное количество последовательных букв в строке
У меня есть этот вектор:
vector <- c("XXXX-X-X", "---X-X-X", "--X---XX", "--X-X--X", "-X---XX-", "-X--X--X", "X-----XX", "X----X-X", "X---XX--", "XX--X---", "---X-XXX", "--X-XX-X")
Я хочу определить максимальное количество последовательных...
327 просмотров
schedule
13.11.2023
Аккуратные данные: переименуйте столбцы, получите имена столбцов, не относящиеся к Северной Америке, а затем соберите
У меня есть довольно уродливые данные, которые нужно привести в порядок, и мне нужна помощь! Как сейчас выглядят мои данные:
countries <- c("Austria", "Belgium", "Croatia")
df <- tibble("age" = c(28,42,19, 67),...
231 просмотров
schedule
04.04.2024
В чем разница между fixed() и coll() для сопоставления строк?
Почти все файлы справки из пакета stringr содержат эту строку
Сопоставьте фиксированную строку (т. е. сравнивая только байты) с помощью fixed(). Это быстро, но приблизительно. Как правило, для сопоставления человеческого текста вам...
236 просмотров
schedule
21.01.2024
Преобразование txt-файла в csv [только определенное содержимое, соответствующее шаблону строки]
У меня есть файл *.DAT, который можно открыть в текстовом редакторе. Я хочу извлечь из этого некоторое содержимое и преобразовать его в *.csv. Преобразованный CSV-файл должен иметь заголовок (имена столбцов), спецификацию (ниже и выше) и часть...
86 просмотров
schedule
01.04.2024
Обработка векторов символов нулевой длины как пустых строк
В качестве примера см. ниже извлечение дескрипторов Twitter. Цель состоит в том, чтобы строка символов напоминала tweets , но имела только дескрипторы, разделенные запятыми. str_replace_all дает пустые векторы, когда совпадения не найдены, и это...
415 просмотров
schedule
07.10.2022
Использование str_wrap() в сочетании с выражением() для получения собственной подписи, подходящей под график в ggplot2.
Я пытаюсь создать собственную подпись, чтобы она соответствовала моему сюжету, чтобы часть текста подписи была выделена жирным шрифтом, а другая часть - простой. В то же время, я хотел бы, чтобы заголовок обтекался, чтобы заголовок не обрезался....
226 просмотров
schedule
27.05.2024
используя функцию аргумента с stringr::str_extract
Я пытаюсь разобрать аргумент пользовательской функции через stringr::str_extract, но не могу заставить его работать.
Вот что я пробовал до сих пор:
library(tidyverse)
extr_var <- function(data, variable) {
res <- data %>%...
29 просмотров
schedule
28.04.2024
Как использовать функцию which в сочетании с grep или stringr в R?
Этот вопрос основан на ответе на мой предыдущий вопрос a-specific-row-what-fulfi">здесь .
На самом деле у меня есть этот фрейм данных:
activity_type leg_mode route_distance
1 home access_walk 239.83275
2 pt interaction...
64 просмотров
schedule
13.11.2023