Вопросы по теме 'word-embedding'

Биграмма в вектор
Я хочу создавать вложения слов для документов с помощью инструмента word2vec. Я знаю, как найти векторное вложение, соответствующее одному слову (униграмме). Теперь я хочу найти вектор для биграммы. Можно ли сделать с помощью word2vec? Если да, то...
5024 просмотров
schedule 13.04.2024

Сходство контекста python word2vec с использованием окружающих слов
Я хотел бы использовать вложения, сделанные w2v, чтобы получить наиболее вероятные заменяющие слова, ДАННЫЕ контексту (окружающие слова), а не предоставлять отдельное слово. Пример: предложение = "Я хочу пойти в парк завтра после школы" Если я...
618 просмотров
schedule 29.10.2023

Использовать учебный код LSTM, чтобы предсказать следующее слово в предложении?
Я пытался понять пример кода с помощью https://www.tensorflow.org/tutorials/recurrent который вы можете найти на https://github.com/tensorflow/models/blob/master/tutorials/rnn/ptb/ptb_word_lm.py . (Используя тензорный поток 1.3.0.) Я...
8267 просмотров

Tensorflow tf.nn.embedding_lookup
есть ли небольшая нейронная сеть в tf.nn.embedding_lookup?? Когда я обучаю некоторые данные, значение того же индекса меняется. Так это тоже обучено? пока я тренирую свою модель Я проверил официальный код embedding_lookup, но не вижу никаких...
898 просмотров

Как инициализировать встраивание слов для слова вне словарного запаса?
Я пытаюсь использовать набор данных CoNLL-2003 NER (английский), и я пытаюсь использовать для него предварительно обученные вложения. Я использую предварительно обученные вложения SENNA. Теперь у меня около 20 тысяч слов в моем словаре, и из них у...
3351 просмотров

Как создать слой встраивания в Tensorflow RNN?
Я строю сеть RNN LSTM для классификации текстов по возрасту авторов (бинарная классификация - молодые/взрослые). Похоже, сеть не учится и вдруг начинает переобучать: Красный: обучение Синий: проверка Одной из возможностей может быть...
2838 просмотров
schedule 23.12.2023

Как использовать мои собственные вложения предложений в Keras?
Я новичок в Keras, и я создал свои собственные вложения предложений tf_idf с формой (no_sentences, embedding_dim). Я пытаюсь добавить эту матрицу в качестве входных данных для слоя LSTM. Моя сеть выглядит примерно так: q1_tfidf =...
883 просмотров

Значение альфа в моделях встраивания слов gensim (Word2Vec и FastText)?
Я просто хочу знать влияние значения альфа в моделях gensim word2vec и fasttext встраивания слов? Я знаю, что альфа - это initial learning rate , а его значение по умолчанию - 0.075 из блога Radim. Что, если я изменю его на немного большее...
1934 просмотров

Классификация текста с собственными вложениями слов с использованием нейронных сетей в R
Это довольно длинно, поэтому, пожалуйста, потерпите меня, к сожалению, ошибка возникает прямо в самом конце ... Я не могу предсказать невидимый набор тестов! Я хотел бы выполнить классификацию текста с встраиванием слов (которое я обучил на своем...
249 просмотров
schedule 18.12.2023

Ограниченный диапазон для встраиваний универсального кодировщика предложений TensorFlow Lite?
Начиная с универсального кодировщика предложений в TensorFlow. .js, я заметил, что диапазон чисел во вложениях был не таким, как я ожидал. Я ожидал некоторого распределения между [0-1] или [-1,1], но не увидел ни одного из них. За предложение...
690 просмотров

Как найти похожие слова в слое Keras Word Embedding
Из курса Стэнфорда CS244N я знаю, что Gensim предоставляет фантастический метод для игры с данными встраивания: most_similar Я пытался найти эквивалент в слое Keras Embedding, но не смог. Это невозможно из коробки от Кераса? Или это была какая-то...
495 просмотров
schedule 23.10.2022

Вложения предложений Берта
Я пытаюсь получить вложения предложений для Берта, но я не совсем уверен, правильно ли я делаю это ... и да, я знаю, что такие инструменты уже существуют, такие как bert-as-service, но я хочу сделать это сам и понять, как это работает. Допустим, я...
2119 просмотров
schedule 20.09.2022

fastText - выдает исключение без каких-либо причин
Я использую fastText реализацию модуля gensim . Несмотря на отсутствие причин, моя программа выдает исключение. Вот код: try: data = [] with open(TXT_PATH, 'r', encoding='utf-8') as txt_file: for line in txt_file:...
78 просмотров

Потеря валидации Keras NLP увеличивается, а точность обучения увеличивается
Я просмотрел другие сообщения с похожими проблемами, и мне кажется, что моя модель переоснащается. Тем не менее, я пробовал регуляризацию, отсев, уменьшение параметров, снижение скорости обучения и изменение функции потерь, но, похоже, ничего не...
247 просмотров

От пустого массива предложений до массива встраивания
Я учусь использовать тензорный поток и пытаюсь классифицировать текст. У меня есть набор данных, в котором каждый текст связан с меткой 0 или 1. Моя цель — использовать встраивание некоторых предложений для классификации. Сначала я создал вложение...
405 просмотров

Gensim 3.8.0 в Gensim 4.0.0
Я обучил модель Word2Vec с помощью Gensim 3.8.0. Позже я попытался использовать предварительно обученную модель с помощью Gensim 4.0.o на GCP. Я использовал следующий код: model = KeyedVectors.load_word2vec_format(wv_path, binary= False) words =...
7162 просмотров
schedule 05.06.2024