Пресловутая проблема данных

Честно говоря, я не знаю ни одного специалиста по данным или инженера по машинному обучению, который сказал бы, что никогда не сталкивался с проблемами качества данных. На самом деле, большинство людей, которых я спрашивал, признают, насколько это может быть кропотливой и трудоемкой задачей. Моя подруга утверждала, что ее работа была «приманкой и подменой» из-за того, что ей приходилось заниматься инженерией и очисткой данных, а не машинным обучением.

Управление качеством данных является узким местом в современной аналитике, поскольку такие трудоемкие задачи, как проверка данных