Если вы хотите узнать больше о науке о данных, связанной с ней терминологии и ее потенциальной применимости в вашем мире, вам может быть полезна книга Кэсси Козырковой «Список основных сведений о статистике: руководство для непочтительного статистика по жаргону».

Вот несколько фрагментов и одна из нескольких простых (и довольно забавных) иллюстраций из этой блестящей и полезной статьи:

⭐️ «Наука о данных — это наука о том, как сделать данные полезными. Три ее поддисциплины называются статистика, машинное обучение и аналитика».

⭐️ «Аналитика — это раздел науки о данных, который часто путают со статистикой. Аналитика — это поиск хороших вопросов, а статистика — поиск хороших ответов. Ключевое отличие состоит в том, что аналитика занимается в первую очередь тем, что находится в ваших данных, а статистика касается того, что находится за пределами ваших данных».

⭐️ «Машинное обучение (МО) — дисциплина, связанная со статистикой, но имеющая другую направленность: автоматизацию. Статистика заботится о точности, выводах и правильном выводе, тогда как машинное обучение заботится о производительности и превращении закономерностей в данных в рецепты, которые позволяют выполнить работу».

Список статистики: непочтительный справочник статистика по жаргону