Я работаю над проблемой машинного обучения, которая выглядит так:
Входные переменные
Categorical
a
b
c
d
Continuous
e
Выходные переменные
Discrete(Integers)
v
x
y
Continuous
z
Основная проблема, с которой я сталкиваюсь, заключается в том, что выходные переменные не полностью независимы друг от друга, и между ними нельзя установить связь. То есть зависимость есть, но не из-за причинно-следственной связи (высокое значение одного значения не означает, что другое значение также будет высоким, но шансы того, что другое значение будет выше, увеличатся)
Примером может быть:
v - Количество показов рекламы
x - количество кликов по объявлению
y - количество конверсий
г - Доход
Теперь, чтобы объявление было нажато, оно должно сначала появиться в поиске, поэтому клик в некоторой степени зависит от показа.
Опять же, для того, чтобы объявление было конвертировано, на него нужно сначала нажать, поэтому опять же конверсия в некоторой степени зависит от клика.
Поэтому запуск 4 экземпляров задачи, предсказывающей каждую из выходных переменных, не имеет для меня смысла. На самом деле должен быть какой-то способ предсказать все 4 вместе, заботясь об их неявных зависимостях.
Но, как видите, прямой зависимости не будет, фактически будет присутствовать вероятность, которую нельзя вычислить вручную.
Кроме того, выходные переменные не являются категориальными, но на самом деле являются дискретными и непрерывными.
Любые входные данные о том, как решить эту проблему. Также покажите мне существующие реализации для того же и какой набор инструментов использовать для быстрой реализации решения.
Просто случайное предположение - я думаю, что эта проблема может быть нацелена на байесовские сети. Как вы думаете ?