Публикации по теме 'nltk'
Как найти последовательный порядковый номер в Python?
Простой код находит последовательные порядковые номера в Python.
Простой вариант использования : проверьте, последовательно ли заданный номер.
Преобразование числа в строку и проверка, является ли это число частью от 1 до 0.
def issequence(num):
if (str(num) in '1234567890'):
return True
else:
return False
Расширенный вариант использования. Получите все числа из текста и отфильтруйте числа, которые находятся в последовательной последовательности...
Предварительная обработка НЛП: - полезный и важный шаг
Вступление
Модель GPT-3 на данный момент стала горячей темой в области обработки естественного языка из-за ее производительности. Он имеет почти 175 миллиардов параметров по сравнению с GPT-2, у которого было около 1,5 миллиардов параметров. Это крупный прорыв в области НЛП. Но этапы предварительной обработки, которые требуются перед обучением любой модели, имеют первостепенное значение. Поэтому в этой статье я объясню все основные шаги, которые используются и требуются при..
Исследование 101 по NER — Распознавание именных сущностей
NER расшифровывается как распознавание именованных объектов. Это метод обработки естественного языка, который включает в себя идентификацию и классификацию именованных сущностей в неструктурированном тексте по заранее определенным категориям, таким как человек, организация, местоположение, дата, время и другие. Целью NER является извлечение структурированной информации из текста, которую затем можно использовать для различных приложений, таких как поиск информации, машинный перевод, анализ..
Jigsaw Непреднамеренная систематическая ошибка в классификации токсичности
Непреднамеренная систематическая ошибка Jigsaw в классификации токсичности
Введение
Команда Conversation AI, исследовательская инициатива, основанная Jigsaw и Google (обе части Alphabet), создает технологию для защиты голоса в разговоре. Основное внимание уделяется моделям машинного обучения, которые могут определять токсичность в онлайн-разговорах, где токсичность определяется как что-либо грубое, неуважительное или иным образом способное заставить кого-то покинуть обсуждение ...
Поиск информации: проводки Unigram и позиционные проводки
Давайте создадим Unigram и позиционные проводки в Python с нуля на реальном наборе данных.
Это второй пост из серии «Поиск информации».
Нажмите здесь , чтобы проверить репозиторий git
Информационно-поисковая серия:
«1. Введение" 2. Индексирование Unigram и позиционное индексирование 3. TF-IDF Еще не все…
Оглавление:
Создание инвертированного индекса Unigram и выполнение сложных логических запросов Создание позиционных индексов и поиск фраз.
Введение..
Вопросы по теме 'nltk'
Python NLTK вычисляет напряжение
У меня есть веб-приложение, которое переводит предложения на английский язык; пользователь выбирает параметры из раскрывающихся списков, которые в основном обеспечивают контекст. Теперь я хочу превратить слово и контекст в английское предложение....
1646 просмотров
schedule
26.03.2024
Могу ли я использовать NLTK, чтобы определить, является комментарий положительным или отрицательным?
Не могли бы вы показать мне простой пример использования http://www.nltk.org/code для определения того, строку о счастливом или расстроенном настроении?
4998 просмотров
schedule
18.11.2022
Проблема Project Gutenberg Python?
Я пытаюсь обрабатывать различные тексты с помощью регулярных выражений и NLTK Python, которые находятся по адресу http://www.nltk.org/book- . Я пытаюсь создать генератор случайного текста, и мне трудно решить проблему. Во-первых, вот мой алгоритм:...
914 просмотров
schedule
01.11.2023
Можно ли идентифицировать содержимое страниц интрасети с помощью распознавания именованных объектов?
Я новичок в обработке естественного языка и хочу узнать больше, создав простой проект. Предполагалось, что NLTK будет популярен в НЛП, поэтому я буду использовать его в своем проекте.
Вот что я хотел бы сделать:
Я хочу просканировать...
236 просмотров
schedule
04.06.2024
Как найти текстовые функции и распечатать их?
Я только начал использовать Natural Language Toolkit (NLTK) как часть моего проекта инженерного колледжа. Кто-нибудь, пожалуйста, скажите мне, как мне прочитать текст входного абзаца и
1) разбить его на текстовые компоненты, т.е. на количество...
247 просмотров
schedule
19.11.2023
Импорт WordNet в NLTK
Я хочу импортировать словарь wordnet , но когда я импортирую словарную форму wordnet , я вижу эту ошибку:
for l in open(WNSEARCHDIR+'/lexnames').readlines():
IOError: [Errno 2] No such file or directory: 'C:\\Program...
33825 просмотров
schedule
05.12.2023
Быстрый расчет n-граммов
Я использую NLTK для поиска n-граммов в корпусе, но в некоторых случаях это занимает очень много времени. Я заметил, что вычисление n-граммов не является редкостью в других пакетах (очевидно, Haystack имеет для этого некоторые функции). Означает ли...
14018 просмотров
schedule
31.03.2024
Сжатие предложений с использованием НЛП
Используя машинный перевод, могу ли я получить очень сжатую версию предложения, например. Мне бы очень хотелось выпить вкусную вкусную чашку кофе будет переведено как Я хочу кофе . Предоставляет ли какая-либо из машин НЛП такую функциональность?...
3941 просмотров
schedule
13.01.2024
Измените re.findall (регулярное выражение, текст) на nltk.Text.findall (регулярное выражение)
Используя Python и NLTK, я написал регулярное выражение для поиска слов, начинающихся с заглавной буквы в тексте, но не в начале предложения.
Первоначально я использовал его следующим образом:
[w for w in text if...
1051 просмотров
schedule
16.10.2022
Как добавить или загрузить файл в корпус nltk?
Я новичок в NLTK и Python. Как мне добавить или загрузить наш собственный файл в корпус nltk? Например, как я могу загрузить свой собственный файл .TXT в корпус ieer? Является ли это возможным? Спасибо.
811 просмотров
schedule
12.12.2022
TF * IDF для поисковых запросов
Хорошо, я слежу за этими двумя сообщениями на TF * IDF, но немного запутался: http://css.dzone.com/articles/machine-learning-text-feature .
По сути, я хочу создать поисковый запрос, содержащий поиск по нескольким документам. Я хотел бы...
8238 просмотров
schedule
19.11.2023
Раскрашивание текста в терминале по частям речи
Я хотел бы раскрасить предложение в терминале, чтобы существительные были синими, а глаголы зелеными. Все остальное будет черным.
До сих пор я пытался использовать для этой цели модули nltk и colorama .
import nltk
from colorama import...
219 просмотров
schedule
18.02.2024
разбор стоп-слов википедии html с помощью nltk
В связи с этим вопросом я работаю над программой для извлечения введения сущностей википедии. Как вы можете прочитать в приведенной выше ссылке, мне уже удалось запросить API, и теперь я сосредоточился на обработке XML, возвращенного вызовом API....
693 просмотров
schedule
09.02.2024
Поиск пути для корпуса в NLTK
Я использую Natural Language Toolkit для Python для написания программы. В нем я пытаюсь загрузить корпус собственных файлов. Для этого я использую следующий код:
from nltk.corpus import PlaintextCorpusReader
corpus_root=(insert filepath here)...
3015 просмотров
schedule
17.05.2024
NLTK с ошибкой импорта колбы
Моя папка в каталоге такова
/maindir
__init__.py
settings.py
start
/run.py
/venv
.. other directories for flask here bin,include..etc
/app
__init__.py
main.py
views.py
/nbc
/__init__.py...
1524 просмотров
schedule
07.03.2024
NLTK - Автоматический перевод похожих слов
Общая цель: я создаю LDA-модель обзоров продуктов на Python, используя NLTK и Gensim. Я хочу запустить это на разных n-граммах.
Проблема . С юниграммами все отлично, но когда я запускаю биграммы, то начинаю получать темы с повторяющейся...
2308 просмотров
schedule
25.01.2024
Импортируйте мои собственные тексты, чтобы использовать тегирование части речи NLTK
Я новичок в этом, но я хотел бы создать папку, в которой у меня будет много текстов (скажем, романы, сохраненные как .txt). Затем я хотел бы попросить пользователя выбрать один из этих романов, а затем автоматически заставить анализатор частей речи...
1255 просмотров
schedule
28.09.2022
Загрузка NLTK Wordnet устарела
Новичок в Python, чтобы начать работу с NLTK. После тяжелой установки Python в моей 64-разрядной системе Windows 7 у меня теперь есть проблемы с загрузкой Wordnet и других пакетов данных NLTK, расположенных здесь:
http://nltk.org/nltk_data/...
1581 просмотров
schedule
31.05.2024
Как найти элементы массива в Python и добавить к нему дополнительную информацию
Я использовал модуль nltk, чтобы пометить предложение. Но тогда мне нужна помощь, чтобы добавить больше информации к токенам, т.е.
перепишите NNP как существительное, а NN как не существительное (другими пренебречь; VBD, IN,..)
добавить...
151 просмотров
schedule
07.12.2022
Проблемы с установкой данных NLTK
Я пытаюсь установить данные NLTK на Mac OSX 10.9. Каталог загрузки, который необходимо установить, как указано в документации NLTK 3.0, — это /usr/share/nltk_data для централизованной установки. Но для этого пути я получаю сообщение об ошибке...
4531 просмотров
schedule
23.05.2024