Нужна помощь в постановке проблемы неопределенного горизонта, минимизации затрат, с обязательным посещением некоторых штатов.
Нам дан бюджет b и матрица затрат M, которая представляет вычет за путешествие между состояниями (Mij представляет стоимость путешествия из i в j), аналогично классической задаче коммивояжера. В этом случае время может быть отрицательным, представляя пополнение бюджета, Mij не обязательно может быть равно Mji. Также в этом случае M равно 4x4, но это может быть не так, обычно допустим, что 3 ‹= len(M) ‹= 5, поскольку я предполагаю, что это может потребовать некоторых методов грубой силы с большим количеством операций...
0 1 -3 1
6 0 2 2
4 2 0 3
1 2 3 0
Каждая строка представляет заданное состояние i, а каждый столбец — стоимость перехода к j.
Таким образом, проблема заключается в следующем: при заданных b и M, за исключением состояния = 0 и состояния = len (M), каково максимальное количество уникальных состояний, в которые мы можем перейти и оказаться в состоянии = len (M) с b> = 0.
Учитывая приведенное выше M и b = 0, я думаю, что вывод будет [2], путь — [0] -> [2] -> [3], а полное развертывание выглядит следующим образом:
state nextstate deduction time
-- 0 --- 0
0 2 -3 3
2 3 3 0
Я попытался решить эту проблему как проблему обучения с подкреплением с помощью электронного жадного решения и эвристической политики для выбора следующего состояния, я также думал об этом как о TSP и рассмотрел решение с использованием Флойда-Уоршалла, но я совершенно уверен, как соответствовать ограничениям в рамках проблемы.
Я думаю, что есть способ найти прямое решение, и моя интуиция, кажется, способна взглянуть на общее М и заданное b и найти решение, но я не могу четко сформулировать алгоритм...
Некоторые направления приветствуются в том, как это четко сформулировать и придумать прямое решение.