Публикации по теме 'nltk'


Как найти последовательный порядковый номер в Python?
Простой код находит последовательные порядковые номера в Python. Простой вариант использования : проверьте, последовательно ли заданный номер. Преобразование числа в строку и проверка, является ли это число частью от 1 до 0. def issequence(num): if (str(num) in '1234567890'): return True else: return False Расширенный вариант использования. Получите все числа из текста и отфильтруйте числа, которые находятся в последовательной последовательности...

Предварительная обработка НЛП: - полезный и важный шаг
Вступление Модель GPT-3 на данный момент стала горячей темой в области обработки естественного языка из-за ее производительности. Он имеет почти 175 миллиардов параметров по сравнению с GPT-2, у которого было около 1,5 миллиардов параметров. Это крупный прорыв в области НЛП. Но этапы предварительной обработки, которые требуются перед обучением любой модели, имеют первостепенное значение. Поэтому в этой статье я объясню все основные шаги, которые используются и требуются при..

Исследование 101 по NER — Распознавание именных сущностей
NER расшифровывается как распознавание именованных объектов. Это метод обработки естественного языка, который включает в себя идентификацию и классификацию именованных сущностей в неструктурированном тексте по заранее определенным категориям, таким как человек, организация, местоположение, дата, время и другие. Целью NER является извлечение структурированной информации из текста, которую затем можно использовать для различных приложений, таких как поиск информации, машинный перевод, анализ..

Jigsaw Непреднамеренная систематическая ошибка в классификации токсичности
Непреднамеренная систематическая ошибка Jigsaw в классификации токсичности Введение Команда Conversation AI, исследовательская инициатива, основанная Jigsaw и Google (обе части Alphabet), создает технологию для защиты голоса в разговоре. Основное внимание уделяется моделям машинного обучения, которые могут определять токсичность в онлайн-разговорах, где токсичность определяется как что-либо грубое, неуважительное или иным образом способное заставить кого-то покинуть обсуждение ...

Поиск информации: проводки Unigram и позиционные проводки
Давайте создадим Unigram и позиционные проводки в Python с нуля на реальном наборе данных. Это второй пост из серии «Поиск информации». Нажмите здесь , чтобы проверить репозиторий git Информационно-поисковая серия: «1. Введение" 2. Индексирование Unigram и позиционное индексирование 3. TF-IDF Еще не все… Оглавление: Создание инвертированного индекса Unigram и выполнение сложных логических запросов Создание позиционных индексов и поиск фраз. Введение..

Вопросы по теме 'nltk'

Python NLTK вычисляет напряжение
У меня есть веб-приложение, которое переводит предложения на английский язык; пользователь выбирает параметры из раскрывающихся списков, которые в основном обеспечивают контекст. Теперь я хочу превратить слово и контекст в английское предложение....
1646 просмотров
schedule 26.03.2024

Могу ли я использовать NLTK, чтобы определить, является комментарий положительным или отрицательным?
Не могли бы вы показать мне простой пример использования http://www.nltk.org/code для определения того, строку о счастливом или расстроенном настроении?
4998 просмотров
schedule 18.11.2022

Проблема Project Gutenberg Python?
Я пытаюсь обрабатывать различные тексты с помощью регулярных выражений и NLTK Python, которые находятся по адресу http://www.nltk.org/book- . Я пытаюсь создать генератор случайного текста, и мне трудно решить проблему. Во-первых, вот мой алгоритм:...
914 просмотров
schedule 01.11.2023

Можно ли идентифицировать содержимое страниц интрасети с помощью распознавания именованных объектов?
Я новичок в обработке естественного языка и хочу узнать больше, создав простой проект. Предполагалось, что NLTK будет популярен в НЛП, поэтому я буду использовать его в своем проекте. Вот что я хотел бы сделать: Я хочу просканировать...
236 просмотров
schedule 04.06.2024

Как найти текстовые функции и распечатать их?
Я только начал использовать Natural Language Toolkit (NLTK) как часть моего проекта инженерного колледжа. Кто-нибудь, пожалуйста, скажите мне, как мне прочитать текст входного абзаца и 1) разбить его на текстовые компоненты, т.е. на количество...
247 просмотров
schedule 19.11.2023

Импорт WordNet в NLTK
Я хочу импортировать словарь wordnet , но когда я импортирую словарную форму wordnet , я вижу эту ошибку: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program...
33825 просмотров
schedule 05.12.2023

Быстрый расчет n-граммов
Я использую NLTK для поиска n-граммов в корпусе, но в некоторых случаях это занимает очень много времени. Я заметил, что вычисление n-граммов не является редкостью в других пакетах (очевидно, Haystack имеет для этого некоторые функции). Означает ли...
14018 просмотров
schedule 31.03.2024

Сжатие предложений с использованием НЛП
Используя машинный перевод, могу ли я получить очень сжатую версию предложения, например. Мне бы очень хотелось выпить вкусную вкусную чашку кофе будет переведено как Я хочу кофе . Предоставляет ли какая-либо из машин НЛП такую ​​функциональность?...
3941 просмотров
schedule 13.01.2024

Измените re.findall (регулярное выражение, текст) на nltk.Text.findall (регулярное выражение)
Используя Python и NLTK, я написал регулярное выражение для поиска слов, начинающихся с заглавной буквы в тексте, но не в начале предложения. Первоначально я использовал его следующим образом: [w for w in text if...
1051 просмотров
schedule 16.10.2022

Как добавить или загрузить файл в корпус nltk?
Я новичок в NLTK и Python. Как мне добавить или загрузить наш собственный файл в корпус nltk? Например, как я могу загрузить свой собственный файл .TXT в корпус ieer? Является ли это возможным? Спасибо.
811 просмотров
schedule 12.12.2022

TF * IDF для поисковых запросов
Хорошо, я слежу за этими двумя сообщениями на TF * IDF, но немного запутался: http://css.dzone.com/articles/machine-learning-text-feature . По сути, я хочу создать поисковый запрос, содержащий поиск по нескольким документам. Я хотел бы...
8238 просмотров
schedule 19.11.2023

Раскрашивание текста в терминале по частям речи
Я хотел бы раскрасить предложение в терминале, чтобы существительные были синими, а глаголы зелеными. Все остальное будет черным. До сих пор я пытался использовать для этой цели модули nltk и colorama . import nltk from colorama import...
219 просмотров
schedule 18.02.2024

разбор стоп-слов википедии html с помощью nltk
В связи с этим вопросом я работаю над программой для извлечения введения сущностей википедии. Как вы можете прочитать в приведенной выше ссылке, мне уже удалось запросить API, и теперь я сосредоточился на обработке XML, возвращенного вызовом API....
693 просмотров

Поиск пути для корпуса в NLTK
Я использую Natural Language Toolkit для Python для написания программы. В нем я пытаюсь загрузить корпус собственных файлов. Для этого я использую следующий код: from nltk.corpus import PlaintextCorpusReader corpus_root=(insert filepath here)...
3015 просмотров
schedule 17.05.2024

NLTK с ошибкой импорта колбы
Моя папка в каталоге такова /maindir __init__.py settings.py start /run.py /venv .. other directories for flask here bin,include..etc /app __init__.py main.py views.py /nbc /__init__.py...
1524 просмотров
schedule 07.03.2024

NLTK - Автоматический перевод похожих слов
Общая цель: я создаю LDA-модель обзоров продуктов на Python, используя NLTK и Gensim. Я хочу запустить это на разных n-граммах. Проблема . С юниграммами все отлично, но когда я запускаю биграммы, то начинаю получать темы с повторяющейся...
2308 просмотров
schedule 25.01.2024

Импортируйте мои собственные тексты, чтобы использовать тегирование части речи NLTK
Я новичок в этом, но я хотел бы создать папку, в которой у меня будет много текстов (скажем, романы, сохраненные как .txt). Затем я хотел бы попросить пользователя выбрать один из этих романов, а затем автоматически заставить анализатор частей речи...
1255 просмотров
schedule 28.09.2022

Загрузка NLTK Wordnet устарела
Новичок в Python, чтобы начать работу с NLTK. После тяжелой установки Python в моей 64-разрядной системе Windows 7 у меня теперь есть проблемы с загрузкой Wordnet и других пакетов данных NLTK, расположенных здесь: http://nltk.org/nltk_data/...
1581 просмотров
schedule 31.05.2024

Как найти элементы массива в Python и добавить к нему дополнительную информацию
Я использовал модуль nltk, чтобы пометить предложение. Но тогда мне нужна помощь, чтобы добавить больше информации к токенам, т.е. перепишите NNP как существительное, а NN как не существительное (другими пренебречь; VBD, IN,..) добавить...
151 просмотров
schedule 07.12.2022

Проблемы с установкой данных NLTK
Я пытаюсь установить данные NLTK на Mac OSX 10.9. Каталог загрузки, который необходимо установить, как указано в документации NLTK 3.0, — это /usr/share/nltk_data для централизованной установки. Но для этого пути я получаю сообщение об ошибке...
4531 просмотров
schedule 23.05.2024