Априорный алгоритм — это алгоритм машинного обучения, который используется для извлечения частых наборов элементов и для создания правил ассоциации из набора данных транзакций.
В основном используется для рекомендаций.
Подумайте, какой супермаркет вы посещаете, например (Bigbazzar, Dmart, Reliance store и т. д.), вы увидите, что существует так много предложений «Купи один — получи один бесплатно» или «Купи два — один бесплатно», например: — если вы купите один дезинфицирующее средство, вы получите одно мыло бесплатно, в этом случае пришел алгоритм Apriori. С помощью априорного алгоритма мы можем рекомендовать продукт, который тесно связан с любым другим продуктом.
Правила ассоциации
Правила ассоциации — это метод, который используется для проверки того, насколько наши элементы тесно связаны друг с другом.
Когда вы покупаете продукт А, сколько сдачи вы купите на продукт Б.
Например: — если вы купите молоко в магазине, то за сколько сдачи люди купят панир или масло.
Чтобы проверить связь между ними, мы используем правило ассоциации.
В ассоциативное правило вошли три понятия: —
1. Поддержка
2. Уверенность
3. Лифт
Поддержка: - С помощью поддержки мы можем рассчитать, насколько популярен тот или иной набор предметов.
Для расчета поддержки у нас есть формула
Поддержка (А) =
(количество транзакций, в которых фигурирует A)/(Всего транзакций)
Доверие: — с помощью параметра «Доверие» мы можем рассчитать процент вероятности покупки товара Y при покупке товара X.
Для расчета доверия у нас есть формула
Уверенность (A-›B) = Поддержка(AUB)/Поддержка(A)
Подъем:соотношение между достоверностью и исключающей достоверностью
Для расчета Лифта у нас есть формула
Подъем = Поддержка (A->B) / Поддержка (A) * Поддержка (B)
Работа априорного алгоритма
Рассмотрим приведенный ниже набор данных о транзакциях в рыночной корзине. Найдите, какой предмет имеет сильную ассоциацию друг с другом.
ШАГ 1: -
Здесь,
Поддержка = 50%
Уверенность = 60%
Поддержка = 50% = 0,5*6 = 3
ШАГ 2: -
Теперь поддержка = 3
ШАГ 3: -
Здесь,
У нас Поддержка = 3
В приведенной выше таблице, если количество меньше 3. Чем мы удаляем этот элемент.
ШАГ 4: -
Теперь мы выполняем те же шаги, что и с двумя элементами.
ШАГ 5: -
Здесь,
Поддержка = 3 Теперь мы удаляем элемент, количество которого здесь меньше 3 (l1, l4), (l3, l4) количество равно 2, 2, поэтому мы удаляем этот элемент.
Из вышеприведенной таблицы можно сказать, что часто встречается l1, l2, l3.
ШАГ 6: -
Теперь мы готовы применить правило ассоциации
Уверенность = 60%
1. l1, l2, => l3
Уверенность = 3/4*100
= 75%
2. l1, l3 => l2
Уверенность = 3/4*100
= 75%
3. l2, l3 => l1
Уверенность = 3/4*100
= 75%
Теперь мы можем сказать, что l1, l2, l3 имеют сильное правило ассоциации.
Применение
1. Мы можем использовать это в супермаркете по рекомендации.
2. Мы можем использовать это в E-start.
3. Мы можем использовать это в индустрии программного обеспечения.
4. Мы также можем использовать это в маркетинговых целях.
Преимущества и недостатки
Преимущества
1. Простой для понимания алгоритм
2. Простота реализации на большом наборе элементов в большой базе данных.
Недостатки
1. Необходимо просканировать всю базу данных
2. Требует высокой вычислительной мощности
Заключение
С помощью априорного алгоритма мы можем увидеть, как продукты связаны друг с другом с помощью правила ассоциации, и рекомендовать им продукт.