Я видел, что существует статья, в которой изложена идея, лежащая в основе Sense2Vec, но как изначально создавались / создавались стандартные модели spaCy? Когда я загружаю что-то вроде стандартной модели "en_core_web_md" из подборки моделей, как это было? на самом деле создано? Могу ли я прочитать какие-нибудь статьи или написать сообщения в блоге?
Бонусный вопрос:
Почему новые модели грядущего spaCy 2.0
стали намного меньше по размеру?
Из обзора версии 2:
В этом выпуске представлены совершенно новые модели, основанные на глубоком обучении, для тегировщика, парсера и распознавателя объектов spaCy. Новые модели в 20 раз меньше линейных моделей, на которых до сих пор работал spaCy: с 300 МБ до всего 15 МБ.
единственная реальная ссылка, которая идет в этом направлении, - это здесь о выпуске резюме. Сводку по всем образцам, занимаемым памятью, можно найти здесь.
Предоставляются ли веса модели и каждый ли вызов для получения соответствующих атрибутов вычисляется на лету? Это объясняет более низкую пропускную способность, показанную в тестах на этой странице.