Специалистът по данни се сблъсква с набори от данни, които са непълни или съдържат данни, които не са уместни. От решаващо значение е данните да бъдат подредени за всеки проект за наука за данни, особено ако върху данните се използва алгоритъм за машинно обучение. Специалистът по данни има множество възможности, когато се опитва да попълни празнини в данните, но коя да избере?