Свързани публикации 'text-processing'


Увеличете производителността на вашата JavaScript обработка на текст с оптимизирано осветяване на фрази
Ако работите с големи количества текст в JavaScript, знаете, че обработката му може да бъде бавна. Една често срещана задача е да откроите конкретни фрази в текста, но традиционният подход може да бъде бавен и неефективен. В тази статия ще проучим как да оптимизираме подчертаването на фрази в JavaScript, за да го направим по-бързо и по-ефективно. Въведение Обработката на текст е често срещана задача в JavaScript, но може да бъде бавна и неефективна, когато се работи с големи..

ScanLines ограничава байтовете в Golang
Голанг ScanLines ограничава байтовете в Golang Когато работим с bufio.ScanLines за извличане на текст от файл на реч, ако низът в реда надвишава сканирането по подразбиране (64K), тогава не можем да получим пълния ред. За да преодолеете този проблем, просто задайте maxCapacity на сканирането. В този пример задаваме maxCapacity на 512MB. Надявам се това да помогне!! МИР!!

Свързани въпроси 'text-processing'

Създаване на проста програма за търсене
Реших да изтрия и да попитам отново, просто беше по-лесно! Моля, не гласувайте против, тъй като сте взели предвид това, което хората казват. Имам два вложени речника: - wordFrequency =...
129 изгледи
schedule 27.09.2022

Има ли инструмент за разделяне на немски сложни думи в java?
Успешно разделям изречения на думи с StringTokenizer . Има ли инструмент, който може да разделя сложни думи като Projektüberwachung на техните части Projekt и überwachung или дори някои по-дълги ? Причината за разделянето на сложните...
2798 изгледи
schedule 13.11.2022

Ефективно анализиране на голям текстов файл в Python?
Имам поредица от големи, плоски текстови файлове, които трябва да анализирам, за да вмъкна в SQL база данни. Всеки запис обхваща няколко реда и се състои от около сто полета с фиксирана дължина. Опитвам се да разбера как ефективно да ги анализирам,...
3816 изгледи
schedule 09.11.2023

Извличане на данни от xml файл
Имам xml файл, съдържащ хиляди записи, като: <gml:featureMember> <Feature> <featureType>JCSOutput</featureType> <property name="gml2_coordsys"></property> <gml:PointProperty>...
4234 изгледи
schedule 26.10.2022

Двойно свързан списък срещу масив в текстови редактори
Започнах експериментален редактор на код, използвайки ncurses. Използвам двойно свързан списък за съхраняване/разбор/отпечатване на текста. Въпреки че съм далеч в изпълнението, не съм решил съвсем дали използването на двойно свързан списък е...
930 изгледи
schedule 05.11.2023

Четене на текстови стойности в променливи на matlab от ASCII файлове
Разгледайте следния файл var1 var2 variable3 1 2 3 11 22 33 Бих искал да заредя числата в матрица и заглавията на колоните в променлива, която би била еквивалентна на: variable_names = char('var1', 'var2', 'variable3');...
34634 изгледи

Получаване на цифров подниз от полета с помощта на awk
Чудех се как мога да получа цифровия подниз от полета с помощта на awk в текстов файл като това, което е показано по-долу. Вече съм запознат с функцията substr(). Въпреки това, тъй като дължината на полетата не е фиксирана, нямам представа как да...
47 изгледи
schedule 08.01.2024

Премахване на текст, който е записан във файл, от множество файлове в linux terminal
Бих искал да премахна текст, който съм записал във файл (тъй като е доста дълъг), за който знам, че е част от много файлове в директория (и нейните поддиректории). Сега искам да премахна този примерен текст от всички тези файлове. Прочетох този ,...
48 изгледи
schedule 07.02.2024

Пренаредете колоните в таблица
Имам файл, разделен с интервал, като този: GID_1 AID_1 2 GID_1 AID_2 1 GID_1 AID_3 3 GID_2 AID_1 3 GID_2 AID_2 1 GID_2 AID_3 2 GID_3 AID_1 1 GID_3 AID_2 1 GID_3 AID_3 3 и бих искал да транспонирам колони 1 и 3 с колона 2 и да имам това:...
69 изгледи
schedule 16.02.2024

tf-idf: правилно ли го разбирам?
Интересувам се от групиране на документи и точно сега обмислям да използвам TF-IDF за това. Ако не греша, TF-IDF се използва по-специално за оценка на уместността на документ при зададена заявка . Ако нямам конкретна заявка, как мога да приложа...
3424 изгледи

Как да четем текстов файл в R като един ред
Опитвам се да обработя текстов файл. Като цяло имам корпус, който бих искал да анализирам. За да използвам пакета tm (пакет за копаене на текст в R), за да създам обект на Corpus, трябва да направя този абзац да се превърне в един гигантски вектор,...
5019 изгледи
schedule 22.03.2024

сравняване на стойности в множество файлове
Имам два файла и всеки файл има 3 колони и n брой редове (различен брой редове във всеки файл). всеки изглежда така: file1 chr1 12 32 chr1 14 30 chr3 10002 89000 chrx 5678900 987654 и този: file2 chr1 8 15 chr1...
459 изгледи
schedule 24.03.2024

Преобразувайте сумите в относителни вероятности
Заден план Създайте вероятен лексикон въз основа на CSV файл с думи и суми. Това е прелюдия към проблем със сегментиране на текст, а не проблем с домашна работа. проблем Даден е CSV файл със следните думи и суми: aardvark,10 aardwolf,9...
274 изгледи
schedule 10.04.2024

Python: Най-добрият начин за премахване на дублиран знак от низ
Как мога да премахна дублирани знаци от низ с помощта на Python? Например, да кажем, че имам низ: foo = "SSYYNNOOPPSSIISS" Как мога да направя низа: foo = SYNOPSIS Нов съм в Python и Какво съм уморен и работи. Знаех, че има...
27914 изгледи
schedule 10.06.2024