Вопросы по теме 'stringr'

лучший способ манипулировать строками в больших данных. таблица
У меня есть строка data.table размером 67 мм с именами и фамилиями людей, разделенными пробелами. Мне просто нужно создать новый столбец для каждого слова. Вот небольшое подмножество данных: n <- structure(list(Subscription_Id =...
706 просмотров
schedule 02.01.2024

Определите постоянно встречающееся растяжение определенных букв в строке с помощью R
Я хотел бы определить, повторяет ли столбец строки в приведенном ниже фрейме данных буквы «V» или «G» не менее 5 раз в пределах первых 20 символов строки. Пример данных: data = data.frame(class = c('a','b','C'), string =...
231 просмотров
schedule 26.04.2024

Почему в этом регулярном выражении отсутствует один пробел между двумя цифрами?
Я пытаюсь найти в строке один пробел, окруженный цифрой с каждой стороны. Я построил следующий пример: library('stringr') str1 <- "1805.6 1-1 1" str_locate_all(str1, "\\s+")[[1]] str_locate_all(str1, "[[:digit:]]\\s[[:digit:]]")[[1]] Что...
81 просмотров
schedule 14.11.2022

Удаление нескольких символов из строки с помощью Stringr
Я новичок в работе со строками в R. Ниже приведен простой фрейм данных с множеством различных входных данных для телефонных номеров, включая некоторые записи вообще без номеров, а только скобки или дефисы. Я ищу способ преобразовать все числа в...
739 просмотров
schedule 05.02.2024

Регулярное выражение R извлекает похожие слова, но у одного есть дефис
У меня есть следующий фрейм данных: species size_description 1 "some text Small some text" 2 "some text small-med some text" 3 "some text Med. some text" 4 "some text medium some text" 5 "some text...
161 просмотров
schedule 05.11.2022

stringr: извлечь слова, содержащие определенное слово
Рассмотрим этот простой пример dataframe <- data_frame(text = c('WAFF;WOFF;WIFF200;WIFF12', 'WUFF;WEFF;WIFF2;BIGWIFF')) > dataframe # A tibble: 2 x 1 text...
3057 просмотров
schedule 23.04.2024

R: простое обнаружение ключевых слов
Я хочу проверить, отображается ли любое из набора "ключевых слов" в строке. Таким образом, для «текст» ниже результат должен быть ИСТИНА (или 1), а для text_2 - ЛОЖЬ (или 0). keywords <- c("one", "two", "three", "four") #set of keywords...
109 просмотров
schedule 17.01.2024

Цикл для извлечения переменной из каждого документа и размещения в соответствующем столбце
Моя компания документирует резюме политик/услуг для каждого клиента в файле в формате pdf. Эти файлы ежегодно объединяются в большой набор данных. Одна строка на клиента и столбцы являются переменными в документе клиента. Этих файлов пара тысяч и в...
63 просмотров
schedule 17.11.2023

переименование всех столбцов фрейма данных с помощью stringr и dplyr
Я пытаюсь переименовать все столбцы в моем фрейме данных, используя dplyr и stringr , но, похоже, он работает не так, как я хочу. Что мне следует изменить в следующем коде, чтобы получить желаемый результат (как показано в приведенном ниже коде)?...
1750 просмотров
schedule 11.11.2023

Поиск строки имени столбца и возврат логических данных для ряда столбцов (R)
Пример данных: example <- data.frame(matrix(NA, ncol=4, nrow=4)) names(example) <- c("reason_code", "d_01", "d_02", "d_03") example$reason_code <- c("d_01, d_03", "d_01", "d_02", "d_02, d_03") Предоставление: reason_code d_01...
506 просмотров
schedule 27.05.2024

Извлечение элементов из текстовых файлов в R
Я пытаюсь заняться анализом текста в R. У меня есть текстовый файл со следующей структурой. HD A YEAR Oxxxx WC 244 words PD 28 February 2018 SN XYZ SC hydt LA English CY Copyright 2018 LP Rio de Janeiro, Feb 28 TD With recreational...
63 просмотров
schedule 09.04.2024

Используйте извлечение и/или разделение, чтобы изолировать переменную строку от фрейма данных
Я просмотрел следующие страницы по использованию регулярного выражения для изоляции строки: Регулярное выражение для извлечения текста между квадратными скобками Что такое группа без захвата? Что делает (?:)? Разделить столбец строки...
218 просмотров
schedule 03.12.2022

Подсчитать максимальное количество последовательных букв в строке
У меня есть этот вектор: vector <- c("XXXX-X-X", "---X-X-X", "--X---XX", "--X-X--X", "-X---XX-", "-X--X--X", "X-----XX", "X----X-X", "X---XX--", "XX--X---", "---X-XXX", "--X-XX-X") Я хочу определить максимальное количество последовательных...
327 просмотров
schedule 13.11.2023

Аккуратные данные: переименуйте столбцы, получите имена столбцов, не относящиеся к Северной Америке, а затем соберите
У меня есть довольно уродливые данные, которые нужно привести в порядок, и мне нужна помощь! Как сейчас выглядят мои данные: countries <- c("Austria", "Belgium", "Croatia") df <- tibble("age" = c(28,42,19, 67),...
231 просмотров
schedule 04.04.2024

В чем разница между fixed() и coll() для сопоставления строк?
Почти все файлы справки из пакета stringr содержат эту строку Сопоставьте фиксированную строку (т. е. сравнивая только байты) с помощью fixed(). Это быстро, но приблизительно. Как правило, для сопоставления человеческого текста вам...
236 просмотров
schedule 21.01.2024

Преобразование txt-файла в csv [только определенное содержимое, соответствующее шаблону строки]
У меня есть файл *.DAT, который можно открыть в текстовом редакторе. Я хочу извлечь из этого некоторое содержимое и преобразовать его в *.csv. Преобразованный CSV-файл должен иметь заголовок (имена столбцов), спецификацию (ниже и выше) и часть...
86 просмотров
schedule 01.04.2024

Обработка векторов символов нулевой длины как пустых строк
В качестве примера см. ниже извлечение дескрипторов Twitter. Цель состоит в том, чтобы строка символов напоминала tweets , но имела только дескрипторы, разделенные запятыми. str_replace_all дает пустые векторы, когда совпадения не найдены, и это...
415 просмотров
schedule 07.10.2022

Использование str_wrap() в сочетании с выражением() для получения собственной подписи, подходящей под график в ggplot2.
Я пытаюсь создать собственную подпись, чтобы она соответствовала моему сюжету, чтобы часть текста подписи была выделена жирным шрифтом, а другая часть - простой. В то же время, я хотел бы, чтобы заголовок обтекался, чтобы заголовок не обрезался....
226 просмотров
schedule 27.05.2024

используя функцию аргумента с stringr::str_extract
Я пытаюсь разобрать аргумент пользовательской функции через stringr::str_extract, но не могу заставить его работать. Вот что я пробовал до сих пор: library(tidyverse) extr_var <- function(data, variable) { res <- data %>%...
29 просмотров
schedule 28.04.2024

Как использовать функцию which в сочетании с grep или stringr в R?
Этот вопрос основан на ответе на мой предыдущий вопрос a-specific-row-what-fulfi">здесь . На самом деле у меня есть этот фрейм данных: activity_type leg_mode route_distance 1 home access_walk 239.83275 2 pt interaction...
64 просмотров
schedule 13.11.2023