Свързани публикации 'text-processing'
Увеличете производителността на вашата JavaScript обработка на текст с оптимизирано осветяване на фрази
Ако работите с големи количества текст в JavaScript, знаете, че обработката му може да бъде бавна. Една често срещана задача е да откроите конкретни фрази в текста, но традиционният подход може да бъде бавен и неефективен. В тази статия ще проучим как да оптимизираме подчертаването на фрази в JavaScript, за да го направим по-бързо и по-ефективно.
Въведение
Обработката на текст е често срещана задача в JavaScript, но може да бъде бавна и неефективна, когато се работи с големи..
ScanLines ограничава байтовете в Golang
Голанг
ScanLines ограничава байтовете в Golang
Когато работим с bufio.ScanLines за извличане на текст от файл на реч, ако низът в реда надвишава сканирането по подразбиране (64K), тогава не можем да получим пълния ред.
За да преодолеете този проблем, просто задайте maxCapacity на сканирането.
В този пример задаваме maxCapacity на 512MB.
Надявам се това да помогне!!
МИР!!
Свързани въпроси 'text-processing'
Създаване на проста програма за търсене
Реших да изтрия и да попитам отново, просто беше по-лесно! Моля, не гласувайте против, тъй като сте взели предвид това, което хората казват.
Имам два вложени речника: -
wordFrequency =...
129 изгледи
schedule
27.09.2022
Има ли инструмент за разделяне на немски сложни думи в java?
Успешно разделям изречения на думи с StringTokenizer .
Има ли инструмент, който може да разделя сложни думи като Projektüberwachung на техните части Projekt и überwachung или дори някои по-дълги ?
Причината за разделянето на сложните...
2798 изгледи
schedule
13.11.2022
Ефективно анализиране на голям текстов файл в Python?
Имам поредица от големи, плоски текстови файлове, които трябва да анализирам, за да вмъкна в SQL база данни. Всеки запис обхваща няколко реда и се състои от около сто полета с фиксирана дължина. Опитвам се да разбера как ефективно да ги анализирам,...
3816 изгледи
schedule
09.11.2023
Извличане на данни от xml файл
Имам xml файл, съдържащ хиляди записи, като:
<gml:featureMember>
<Feature>
<featureType>JCSOutput</featureType>
<property name="gml2_coordsys"></property>
<gml:PointProperty>...
4234 изгледи
schedule
26.10.2022
Двойно свързан списък срещу масив в текстови редактори
Започнах експериментален редактор на код, използвайки ncurses. Използвам двойно свързан списък за съхраняване/разбор/отпечатване на текста. Въпреки че съм далеч в изпълнението, не съм решил съвсем дали използването на двойно свързан списък е...
930 изгледи
schedule
05.11.2023
Четене на текстови стойности в променливи на matlab от ASCII файлове
Разгледайте следния файл
var1 var2 variable3
1 2 3
11 22 33
Бих искал да заредя числата в матрица и заглавията на колоните в променлива, която би била еквивалентна на:
variable_names = char('var1', 'var2', 'variable3');...
34634 изгледи
schedule
22.11.2023
Получаване на цифров подниз от полета с помощта на awk
Чудех се как мога да получа цифровия подниз от полета с помощта на awk в текстов файл като това, което е показано по-долу. Вече съм запознат с функцията substr(). Въпреки това, тъй като дължината на полетата не е фиксирана, нямам представа как да...
47 изгледи
schedule
08.01.2024
Премахване на текст, който е записан във файл, от множество файлове в linux terminal
Бих искал да премахна текст, който съм записал във файл (тъй като е доста дълъг), за който знам, че е част от много файлове в директория (и нейните поддиректории). Сега искам да премахна този примерен текст от всички тези файлове.
Прочетох този ,...
48 изгледи
schedule
07.02.2024
Пренаредете колоните в таблица
Имам файл, разделен с интервал, като този:
GID_1 AID_1 2
GID_1 AID_2 1
GID_1 AID_3 3
GID_2 AID_1 3
GID_2 AID_2 1
GID_2 AID_3 2
GID_3 AID_1 1
GID_3 AID_2 1
GID_3 AID_3 3
и бих искал да транспонирам колони 1 и 3 с колона 2 и да имам това:...
69 изгледи
schedule
16.02.2024
tf-idf: правилно ли го разбирам?
Интересувам се от групиране на документи и точно сега обмислям да използвам TF-IDF за това.
Ако не греша, TF-IDF се използва по-специално за оценка на уместността на документ при зададена заявка . Ако нямам конкретна заявка, как мога да приложа...
3424 изгледи
schedule
29.02.2024
Как да четем текстов файл в R като един ред
Опитвам се да обработя текстов файл. Като цяло имам корпус, който бих искал да анализирам. За да използвам пакета tm (пакет за копаене на текст в R), за да създам обект на Corpus, трябва да направя този абзац да се превърне в един гигантски вектор,...
5019 изгледи
schedule
22.03.2024
сравняване на стойности в множество файлове
Имам два файла и всеки файл има 3 колони и n брой редове (различен брой редове във всеки файл).
всеки изглежда така:
file1
chr1 12 32
chr1 14 30
chr3 10002 89000
chrx 5678900 987654
и този:
file2
chr1 8 15
chr1...
459 изгледи
schedule
24.03.2024
Преобразувайте сумите в относителни вероятности
Заден план
Създайте вероятен лексикон въз основа на CSV файл с думи и суми. Това е прелюдия към проблем със сегментиране на текст, а не проблем с домашна работа.
проблем
Даден е CSV файл със следните думи и суми:
aardvark,10
aardwolf,9...
274 изгледи
schedule
10.04.2024
Python: Най-добрият начин за премахване на дублиран знак от низ
Как мога да премахна дублирани знаци от низ с помощта на Python? Например, да кажем, че имам низ:
foo = "SSYYNNOOPPSSIISS"
Как мога да направя низа:
foo = SYNOPSIS
Нов съм в Python и Какво съм уморен и работи. Знаех, че има...
27914 изгледи
schedule
10.06.2024