Создателю Azure QnA нужна консультация по источнику данных

Мы пытаемся создать чат-бота с часто задаваемыми вопросами, используя службу Azure QnA maker. Я прочитал документацию, в которой говорится, что допустимые форматы файлов для создания базы знаний: PDF, word, xls, doc, tsv и txt. Опубликованная нами документация по продукту доступна в формате PDF, но в нем слишком много информации, и мы не склонны использовать этот файл для создания базы знаний в QnA maker. Вместо этого мы надеялись использовать наши необработанные файлы документации в формате DITA.

Не могли бы вы посоветовать нам, что нам следует делать в этом случае? Любые предложения или рекомендации приветствуются.

Спасибо.


person Vijay Anand    schedule 04.03.2019    source источник


Ответы (1)


Как вы упомянули, вы можете импортировать файлы следующих типов: PDF, word, xls, doc, tsv и txt.

Я настоятельно рекомендую вам преобразовать вашу документацию DITA в tsv файл, который представляет собой простой question TAB answer (см. Образец здесь). Таким образом вы избежите потенциальных ошибок, которые могут возникнуть при импорте файлов PDF / Word / XLS / Doc из-за специфического синтаксиса каждого типа.

С TSV вы мастер правильного разделения своих вопросов / ответов.

person Nicolas R    schedule 06.03.2019