В настоящее время я работаю над реализацией языковой модели сглаживания отсрочки katz. у меня есть некоторое замешательство по поводу рекурсивной отсрочки и моделей более низкого порядка расчета α. Предположим, что модель Каца для триграммы задана как
Pkatz(wi|wi-2wi-1)= P(w i|wi-2wi-1), если C(wi-2wi- 1wi) > 0
или α1P(wi|wi-1 ), если C(wi-2wi-1wi) = 0 и C(w i-1wi) > 0
или α2P(wi), иначе
Я также знаю, что α1 для случая биграммы рассчитывается на основе скидок, найденных в модели триграммы, но меня смущает то, как она вычисляет α2 для униграммы более низкого порядка. Используются ли скидки из триграммной модели или скидки из биграммной модели, если и триграмма, и биграмма не имеют доказательств?