Наземная правда, которую мы знаем, используется для переобучения NLC или R&R.
Основная истина - это данные обучения на уровне вопросов.
e.g.
"Как жарко сегодня?, температура"
На вопрос "как сегодня жарко?" поэтому классифицируется как «температурный» класс.
Как только приложение будет запущено, будут получены реальные вопросы пользователей. Некоторые из них одинаковы (т.е. вопросы от реальных пользователей совпадают с вопросом в земной истине), некоторые являются похожими терминами, некоторые являются новыми вопросами. Предположим, что приложение имеет цикл обратной связи, чтобы узнать, релевантны ли класс (для NLC) или ответ (для R&R).
About the new questions, the approach seems to just add the them to the ground truth, which is then used to re-train the NLC/R&R?
For the questions with similar terms, do we just add them like the new questions, or do we just ignore them, given that similar terms can also be scored well even similar terms are not used to train the classifier?
In the case of the same questions, there seems nothing to do on the ground truth for NLC, however, to the R&R, are we just increase or decrease 1 for the relevance label in the ground truth?
Короче говоря, главный вопрос здесь в том, каков подход к переподготовке для NLC & R&R...