Публикации по теме 'linguistics'


Четыре ошибки, которые вы делаете при маркировке данных
Контрольный список того, что может пойти не так, и как это исправить Маркировка данных для НЛП, как и полет на самолете, на первый взгляд кажется легким, но может пойти не так, как ни странно. Знание того, что может пойти не так и почему, - хорошие первые шаги к обнаружению и исправлению ошибок. Маркировка данных для НЛП - это то, что на первый взгляд кажется простым, но может пойти не так, как ни странно, но и замечательно. Знание того, что может пойти не так и почему, - хорошие..

Вы получаете то, что видите!
Разрешение местоимений к определенным предметам / объектам в данном предложении всегда было открытой темой исследования в компьютерной лингвистике и обработке естественного языка. Это требует сложных рассуждений из различных информационных источников и контекстных знаний. Чтобы решить эту проблему, в статье То, что вы видите, то и получаете: разрешение визуальной привязки местоимений в диалогах определяется задача визуально-ориентированного разрешения совместной ссылки местоимений..

Уничтожение Wordle
Что вы получите, если скрестите загадку с программистом? Вы получите то, чего заслуживаете! (нужно оставить PG-13 bois…) Акт -1: Головоломка О, ты знаешь загадку. ВСЕ ЗНАЮТ ЗАГАДКУ. вы гадаете, гадаете и гадаете... и с каждым предположением вы видите, что доверие к вам как к носителю английского языка уменьшается (если вы не можете угадать его менее чем за пять попыток, тогда вы можете проявить свои языковые способности) Прежде чем продолжить, я рекомендую вам ознакомиться..

Формальная грамматика и теория информации
Естественный язык — это сложный объект, и для его обработки с помощью компьютерной программы нам необходимо построить его модель. Два популярных подхода к построению языковой модели: Рационалист: характеризуется верой в то, что значительная часть знаний в человеческом уме не выводится органами чувств, а фиксируется заранее. Эмпирик: Этот подход…

Стилизация JavaScript для чтения на английском языке
Читабельность — это высшее качество хорошо поддерживаемого кода. Это улучшает опыт разработчиков, но также снижает затраты в долгосрочной перспективе. Во многих случаях разработчики тратят больше времени на чтение существующего кода, чем на написание нового кода. Чем быстрее инженер сможет понять, что делает существующий код, тем скорее он сможет перейти к его использованию, исправлению, расширению, замене или даже удалению ! Введите стиль: создайте код, читаемый как родной язык..

Эмпиризм, рационализм, суперэмпиризм: последние изменения в представлениях о разуме
Философов постоянно интересует вопрос, в какой степени наша ментальная жизнь зависит от опыта: от того, что дает чувственное восприятие. Британские эмпирики , такие как Джон Локк, думали, что разум - это tabula rasa, чистый лист бумаги, готовый принимать данные из мира и на этой основе формировать идеи, составляющие содержание мысли. Другие в этом сомневались. Для рационалистов были идеи, которые не могли возникнуть на основе опыта, и поэтому, поскольку они у нас были, мы, должно быть,..

Вопросы по теме 'linguistics'

Qt Linguist - установить переводчик для файлов приложения Qt *.ui
Я написал крошечный простой пример для изменения языка приложений после выбора языка в меню. Хотя соединение работает (qDebug() печатает хорошие сообщения), оно не меняет текст в моем QLabel. Я создал графический интерфейс с помощью QtDesigner....
4291 просмотров
schedule 03.02.2024

Как разобрать имена из необработанного текста
Мне было интересно, знает ли кто-нибудь о каких-либо хороших библиотеках или методах разбора имен из необработанного текста. Например, скажем, у меня есть это в качестве примеров: (обратите внимание, что иногда это кортежи с заглавной буквы, а...
1470 просмотров
schedule 29.11.2022

Дерево вероятностей для предложений в nltk, использующих как упреждающие, так и ретроспективные зависимости
Позволяет ли nltk или любой другой инструмент NLP строить деревья вероятностей на основе входных предложений, сохраняя таким образом языковую модель входного текста в дереве словаря, следующее пример дает приблизительное представление, но мне нужна...
1085 просмотров
schedule 12.10.2022

как изменить Wordnet Lemmatizer для леммитизации определенных слов?
Я применяю лемматизатор wordNet в своем корпусе, и мне нужно определить тег pos для лемматизатора: stemmer = PorterStemmer() def lemmitize(document): return stemmer.stem(WordNetLemmatizer().lemmatize(document, pos='v')) def...
1578 просмотров

Получение неправильной маркировки POS
Я пытаюсь получить POS для предложения dragon flies to rescue the princess , используя приведенный ниже код nlp = spacy.load("en_core_web_md") doc = nlp("dragon flies to rescue the princess") for token in doc: print(f'{token.text:{12}}...
230 просмотров
schedule 22.03.2024