Есть несколько проблем с тем, как вы настраиваете свою модель.
1) Время в том виде, в каком оно у вас есть, никогда не должно быть категоричным. В вашей модели время 12:29 и 12:30 рассматривается как два совершенно независимых атрибута. Таким образом, он никогда не будет использовать факты, полученные в 12:29, чтобы предсказать, что произойдет в 12:30. В вашем случае вы либо должны установить числовое время. Не уверен, что amazon ML может конвертировать его для вас автоматически. Если не просто умножить час на 60 и добавить к нему минуты. Еще одна интересная вещь, которую можно сделать, — это разделить свое время, выбрав получасовой или более широкий интервал. Вы делаете это, разделив (ч * 60 + м) на некоторое число в зависимости от того, сколько ведер вы хотите. Итак, попробуйте 120, чтобы получить 2-часовые интервалы. Как правило, чем больше данных у вас есть, тем меньшие интервалы вы можете иметь. Главное, чтобы в каждом ведре было много образцов.
2) Вы действительно должны подумать об удалении restaurantID из ваших входных данных. Наличие его там приведет к тому, что модель будет слишком подходить к нему. Таким образом, он не сможет делать прогнозы о ресторане с идентификатором: 5 на основе фактов, которые он узнает из ресторанов с идентификатором: 3 или идентификатором: 9. Иметь идентификатор ресторана может быть хорошо, если у вас есть много данных о каждом ресторане, и вы не заботитесь об экстраполяции своих прогнозов на рестораны, которых нет в тренировочном наборе.
3) Вы никогда не отправляете restaurantID, чтобы предсказать данные о нем. Как это обычно работает, вам нужно выбрать то, что вы пытаетесь предсказать. В вашем случае, вероятно, наиболее полезным атрибутом является «waitingTime». Итак, вам нужно отправить день недели, время и количество людей, и модель выведет время ожидания.
person
Vlad
schedule
04.02.2017