скрипт Python для извлечения именованных сущностей с фреймворком чутья, застрявшим во время обучения

Это мой код, который я пытаюсь обучить, чтобы получить предварительно обученную модель для извлечения именованных объектов на французском языке. Я использую Google Colab в качестве среды, так как мой ноутбук имеет только 4 ГБ графического процессора, тогда как Colab предлагает 12 ГБ графического процессора. К сожалению, в colab скрипт каждый раз застревает в эпохе 1. может ли кто-нибудь предложить мне решение или совет, чтобы решить мою проблему? большое спасибо ! КОД :

from flair.visual.training_curves import Plotter
from flair.trainers import ModelTrainer
from flair.models import SequenceTagger
from flair.data import TaggedCorpus
from flair.data_fetcher import NLPTaskDataFetcher, NLPTask
from flair.embeddings import TokenEmbeddings, WordEmbeddings, 
StackedEmbeddings
from flair.embeddings import FlairEmbeddings, BertEmbeddings
from typing import List
from flair.data import Sentence 
# import flair.datasets
# 1. get the corpus
corpus = NLPTaskDataFetcher.load_corpus(NLPTask.WIKINER_FRENCH)
# 2. what tag do we want to predict?
tag_type = 'ner'
# 3. make the tag dictionary from the corpus
tag_dictionary = corpus.make_tag_dictionary(tag_type=tag_type)
print(tag_dictionary.idx2item)
# large embedding configuration - comment this in for a better model
embeddings = StackedEmbeddings(
   [WordEmbeddings('fr'),
   FlairEmbeddings('french-forward', use_cache=True),
   FlairEmbeddings('french-backward', use_cache=True)])
# 5. initialize sequence tagger

tagger: SequenceTagger = SequenceTagger(hidden_size=256,
                                    embeddings=embeddings,
                                    tag_dictionary=tag_dictionary,
                                    tag_type=tag_type,
                                    use_crf=True)
# # 6. initialize trainer

trainer: ModelTrainer = ModelTrainer(tagger, corpus)

# 7. start training
trainer.train('resources/taggers/example-ner',
          learning_rate=0.1,
          mini_batch_size=32,
          max_epochs=150)

person Houssem Bzi    schedule 24.05.2019    source источник
comment
КОД ОТСУТСТВУЕТ!   -  person sahasrara62    schedule 24.05.2019
comment
лучше добавить код, чем изображение, чтобы другие могли воспроизвести вашу ошибку   -  person sahasrara62    schedule 24.05.2019
comment
любые идеи о том, как преодолеть эту проблему? или почему он не может правильно тренироваться на colab? Благодарность   -  person Houssem Bzi    schedule 24.05.2019
comment
я не знаю, пока не занимаюсь задачей ml/ai, лучше добавить тег colab, чтобы другие могли вам помочь   -  person sahasrara62    schedule 24.05.2019


Ответы (1)


Вы можете указать mini_batch_chunk_size и mini_batch_size, как показано ниже:

 trainer.train('resources/taggers/example-ner',
               learning_rate=0.1, 
               mini_batch_chunk_size=2,
               mini_batch_size=8,
               max_epochs=150)

person Wahid Benz    schedule 09.12.2020