В сегодняшнем быстро развивающемся мире наука о данных стала будущим, и компании вкладывают значительные средства в эту область. Машинное обучение, глубокое обучение и компьютерное зрение — вот некоторые из трендовых технологий, частью которых хочет стать каждый. Но как начать это бесконечное путешествие? В этой статье я объясню основные источники и материалы, которые, несомненно, помогут вам понять более глубокие концепции. Более того, я постарался включить как можно больше бесплатных источников, чтобы сделать обучение доступным для всех.

Прежде чем мы углубимся в ресурсы, я хотел бы упомянуть несколько важных вещей, которым необходимо следовать:

  1. Математика имеет решающее значение: Честно говоря, наука о данных — это все о статистике. Если вы думаете, что можете пропустить изучение математики, стоящей за этим, и сразу начать кодирование, копируя репозитории GitHub, извините, но это путешествие может вам не подойти.
  2. Цените понимание выше сертификатов: сертификаты — это здорово, но не гонитесь за ними вслепую. Завершение курса без полного понимания концепций не уведет вас далеко. Изучайте и понимайте материал, и ваши проекты будут говорить за вас.
  3. Перестаньте бегать за сертификатами: язнаю, что вы все любите сертификаты и как много они для вас значат, но задумывались ли вы когда-нибудь, какова цель такого достижения, о котором вы даже толком не знаете? вы только что закончили 5-недельный курс, пропустив видео или отправив скопированные задания, сначала начните учиться и понимать, что ваши проекты будут говорить за вас

Статистика и математика:

Предполагая, что у вас есть базовое представление о статистике, например: «Это раздел математики, который занимается сбором и анализом числовых данных в больших количествах», вы можете начать с Академии Хана. Это бесплатная учебная платформа, предлагающая курс по статистике и вероятности, который охватывает все, от основ до продвинутых тем. Платформа делает обучение увлекательным благодаря уникальной игровой среде, викторинам и задачам.

Кроме того, вы можете обратиться к StatQuest, каналу Джоша Стармера на YouTube, который упрощает сложные понятия, такие как P-значения, и дает вам представление о том, почему изучение статистики так важно.

Программирование на Питоне:

Если у вас есть предыдущий опыт программирования на таких языках, как C, C++ или Java, изучение Python будет относительно простым. Однако, даже если вы новичок, Python — самый простой и эффективный язык для начала. Рекомендуемая книга для изучения Python — «Python Crash Course». Он охватывает основные команды Python, концепции ООП, работу с файлами и предлагает практическую практику, в которой вы создадите свою собственную игру Python, используя различные концепции программирования.

Если вы предпочитаете онлайн-видеоуроки, посмотрите «Telusko» и «Corey Schafer» на YouTube. И программисты на Python, и ютуберы прекрасно объясняют каждую концепцию.

Блокнот Jupyter и iPython:

Для написания кода на Python я настоятельно рекомендую использовать Jupyter Notebook. Это удобно, и каждая команда выполняется в отдельных ячейках. Вы можете получить доступ к документации с примерами в ячейке, используя Shift + Tab, и автозаполнение ранее определенных функций или переменных с помощью клавиши Tab. Для начала будет достаточно небольшого изучения официальной документации или YouTube.

Библиотеки Python для науки о данных:

По мере продвижения вы столкнетесь с различными библиотеками, но сначала сосредоточьтесь на этих четырех: NumPy, Pandas, Matplotlib и Seaborn. Сначала ознакомьтесь с ними:

  • NumPy: Предоставляет высокопроизводительные многомерные массивы и инструменты для работы с ними. import numpy as np обычно используется.
  • Pandas: наиболее широко используется для обработки данных, предлагая высокоуровневые структуры данных и инструменты для манипулирования. import pandas as pd.
  • Matplotlib: комплексная библиотека для создания статических, анимированных и интерактивных визуализаций, включая графики и графики. import matplotlib.pyplot as plt.
  • Seaborn: библиотека визуализации данных Python на основе Matplotlib, предлагающая высокоуровневые интерфейсы для рисования привлекательной и информативной статистической графики. import seaborn as sns.

Для этих библиотек лучшим источником является их официальная документация, оформленная в виде мини-книг с примерами и пояснениями всех параметров. Кроме того, загляните в «Школу данных», где вы найдете отличные онлайн-уроки и советы, которые вы не найдете больше нигде.

Я предоставил ссылки на все источники, обсуждаемые ниже. Приятного обучения!

ссылки и источники изображений:

Изображение1 - https://www.memesmonkey.com/topic/data+science#&gid=1&pid=2

Школа данных — https://www.youtube.com/results?search_query=the+data+school

Telusko- https://www.youtube.com/results?search_query=telusko

Кори- https://www.youtube.com/results?search_query=corey+schafer

Академия Хана — https://www.khanacademy.org/math/statistics-probability

Statquest- https://www.youtube.com/results?search_query=statquest