Я пытаюсь использовать набор данных CoNLL-2003 NER (английский), и я пытаюсь использовать для него предварительно обученные вложения. Я использую предварительно обученные вложения SENNA. Теперь у меня около 20 тысяч слов в моем словаре, и из них у меня есть встраивание только для 9,5 тысяч слов.
Мой текущий подход состоит в том, чтобы инициализировать массив 20k X embedding_size
нулями и инициализировать 9,5 тысяч слов, вложения которых мне известны и сделайте все вложения доступными для обучения.
У меня вопрос, как лучше всего это сделать? Любая ссылка на такое исследование будет очень полезной?