Помните это?

Это Pokedex, и если вам интересно, да, в этом путешествии будет много повторяющихся ссылок на наших Pokepals. Pokedex — это, по сути, ваш телефон, за исключением того, что его единственная возможность — гуглить покемонов. У каждого героя есть. Не покедекс, а своего рода помощник «всезнайка». Человек или устройство, которое остается рядом с вами во время путешествия и по совпадению имеет ответы на самые произвольные вопросы и решения самых трудных проблем, с которыми вы сталкиваетесь. У Люка был R2D2, у мистера Бернса — Смитерс, и даже у Куэйлмана было на кого положиться.

И все они выступили превосходно, имея достаточно времени, чтобы заинтриговать аудиторию, но недостаточно, чтобы отвлечь внимание от нашего героя или путешествия, потому что давайте посмотрим правде в глаза…

Вот почему я разработал Datadex. Что такое Datadex, Ник? Отличный вопрос, вымышленная аудитория, рад, что вы его задали. Datadex принимает RDQ, случайные вопросы по науке о данных и выдает ответы. Итак, я в основном нахожу ответы на случайные вопросы о науке о данных, которые появляются и вылетают из моей головы в течение дня, и публикую ответы здесь в виде коротких, но очень информативных (надеюсь) статей.

Это позволит выполнить две вещи. Первый - наполнитель. Документация поможет медленно заполнить обильные пробелы в знаниях, которые могут быть у меня или у вас, моей любимой фиктивной аудитории, а второй будет заполнителем (опять же). Пока вы ждете следующего эпизода «Дороги к гроссмейстеру Kaggle», эти RDQ будут держать вас в курсе жаргона, техник и всего полезного, что мы можем найти на этом пути.

Таким образом, имея достаточно времени, чтобы заинтриговать аудиторию, но недостаточно, чтобы отвлечь внимание от нашего героя (меня), Datadex станет идеальным дополнением на пути к Kaggle Grandmaster.

— Ник, я все еще не понимаю. Хорошо, давайте рассмотрим пару, чтобы сдвинуться с мертвой точки.

Случайные вопросы по науке о данных (RDQ):

  1. Как мне объяснить науку о данных моему уродливому маленькому двоюродному брату?

«Представьте, что вы продолжаете проигрывать какому-то боссу в видеоигре, и как бы вы ни старались, вы не можете победить. Вы заметили, что в том, как они двигаются и как они атакуют, есть какая-то закономерность, но у вас пока недостаточно информации, чтобы победить, поэтому вы обращаетесь к Интернету. Вы просматриваете форумы и блоги для получения дополнительной информации (сбор данных).

Вскоре у вас будет достаточно советов и приемов, чтобы снова сразиться с боссом, но на этот раз у вас гораздо больше информации, чем раньше. На этот раз вы можете использовать то, чему научились, чтобы более точно предвидеть (прогнозировать) поведение этой неприятности. В этом примере немного некрасиво, вы то, что мы называем моделью. Мы загрузили вас кучей данных (советы и подсказки с форумов + то, что вы узнали на собственном опыте) в надежде, что вы сможете предсказать поведение начальника и решить проблему.

Это, грубо говоря, наука о данных. Вы нашли проблему, собрали кучу данных, обработали их, а затем использовали для построения решения своей проблемы.

Вот короткое 5-минутное видео, если мое объяснение было слишком абстрактным.

Это наука о данных… вроде того.

Оставайтесь с нами для следующего эпизода «Дороги к гроссмейстеру Kaggle».