Я видел несколько статей и примеров выбора функций (обертка и встроенные методы), в которых образцы данных разбивались на обучающие и тестовые наборы.
Я понимаю, почему нам нужно использовать перекрестную проверку (разделить данные на набор для обучения и тестирования) для построения и тестирования оценок моделей (фактическое прогнозирование предлагаемого алгоритма).
Но я не могу понять, что побуждает сделать это при выборе функции?
Нет никаких истинных результатов того, какие функции нам нужно выбрать, так как же это может улучшить процесс выбора функций?
Какая польза?