Как вычисляется значение α в языковой модели Katz Backoff?

В настоящее время я работаю над реализацией языковой модели сглаживания отсрочки katz. у меня есть некоторое замешательство по поводу рекурсивной отсрочки и моделей более низкого порядка расчета α. Предположим, что модель Каца для триграммы задана как

P_katz(w_i|w_i-2w_i-1)= P(w_i|w_i-2w_i-1), если C(w_i-2w_{i- 1}w_i) > 0
или α₁P(w_i|w_i-1), если C(w_i-2w_i-1w_i) = 0 и C(w_i-1w_i) > 0
или α₂P(w_i), иначе

Я также знаю, что α1 для случая биграммы рассчитывается на основе скидок, найденных в модели триграммы, но меня смущает то, как она вычисляет α2 для униграммы более низкого порядка. Используются ли скидки из триграммной модели или скидки из биграммной модели, если и триграмма, и биграмма не имеют доказательств?

riaz 28.03.2016 источник

comment

Либо используется фиксированная скидка для всех уровней ngram, либо используется конкретная скидка для каждого уровня. Я не знаю точного ответа, но уверен, что вы можете найти его в статье Гудмана и Чена (стр. 6): u.cs.biu.ac.il/~yogo/courses/mt2013/papers/chen-goodman-99.pdf - user3639557 29.03.2016

comment

Уважаемый пользователь 3639557, большое спасибо за ваши предложения. Я прочитал статью Чена и Гудмана, но я все еще не понимаю рекурсивную реализацию отсрочки Каца и расчет параметра α2. мне нужно конкретное решение для этого. - riaz 30.03.2016

Ответы (1)

arrow_upward
0
arrow_downward

В основном альфа основана на «отсутствующей массе вероятности». Альфа должна убедиться, что сумма вероятности моделей ngram, включая отсрочку, равна 1.

Итак, на ваш вопрос, если у вас есть скидка в биграмме, некоторые вероятности будут отсутствовать. Я думаю, вам нужно использовать 1 - сумма вероятностей триграмм - альфа * сумма вероятностей биграмм, чтобы найти следующую альфу для униграммы.

Jianxin Liu 11.10.2019

Как вычисляется значение α в языковой модели Katz Backoff?

Ответы (1)

Похожие вопросы