В сегодняшнем быстро развивающемся мире наука о данных стала будущим, и компании вкладывают значительные средства в эту область. Машинное обучение, глубокое обучение и компьютерное зрение — вот некоторые из трендовых технологий, частью которых хочет стать каждый. Но как начать это бесконечное путешествие? В этой статье я объясню основные источники и материалы, которые, несомненно, помогут вам понять более глубокие концепции. Более того, я постарался включить как можно больше бесплатных источников, чтобы сделать обучение доступным для всех.
Прежде чем мы углубимся в ресурсы, я хотел бы упомянуть несколько важных вещей, которым необходимо следовать:
- Математика имеет решающее значение: Честно говоря, наука о данных — это все о статистике. Если вы думаете, что можете пропустить изучение математики, стоящей за этим, и сразу начать кодирование, копируя репозитории GitHub, извините, но это путешествие может вам не подойти.
- Цените понимание выше сертификатов: сертификаты — это здорово, но не гонитесь за ними вслепую. Завершение курса без полного понимания концепций не уведет вас далеко. Изучайте и понимайте материал, и ваши проекты будут говорить за вас.
- Перестаньте бегать за сертификатами: язнаю, что вы все любите сертификаты и как много они для вас значат, но задумывались ли вы когда-нибудь, какова цель такого достижения, о котором вы даже толком не знаете? вы только что закончили 5-недельный курс, пропустив видео или отправив скопированные задания, сначала начните учиться и понимать, что ваши проекты будут говорить за вас
Статистика и математика:
Предполагая, что у вас есть базовое представление о статистике, например: «Это раздел математики, который занимается сбором и анализом числовых данных в больших количествах», вы можете начать с Академии Хана. Это бесплатная учебная платформа, предлагающая курс по статистике и вероятности, который охватывает все, от основ до продвинутых тем. Платформа делает обучение увлекательным благодаря уникальной игровой среде, викторинам и задачам.
Кроме того, вы можете обратиться к StatQuest, каналу Джоша Стармера на YouTube, который упрощает сложные понятия, такие как P-значения, и дает вам представление о том, почему изучение статистики так важно.
Программирование на Питоне:
Если у вас есть предыдущий опыт программирования на таких языках, как C, C++ или Java, изучение Python будет относительно простым. Однако, даже если вы новичок, Python — самый простой и эффективный язык для начала. Рекомендуемая книга для изучения Python — «Python Crash Course». Он охватывает основные команды Python, концепции ООП, работу с файлами и предлагает практическую практику, в которой вы создадите свою собственную игру Python, используя различные концепции программирования.
Если вы предпочитаете онлайн-видеоуроки, посмотрите «Telusko» и «Corey Schafer» на YouTube. И программисты на Python, и ютуберы прекрасно объясняют каждую концепцию.
Блокнот Jupyter и iPython:
Для написания кода на Python я настоятельно рекомендую использовать Jupyter Notebook. Это удобно, и каждая команда выполняется в отдельных ячейках. Вы можете получить доступ к документации с примерами в ячейке, используя Shift + Tab, и автозаполнение ранее определенных функций или переменных с помощью клавиши Tab. Для начала будет достаточно небольшого изучения официальной документации или YouTube.
Библиотеки Python для науки о данных:
По мере продвижения вы столкнетесь с различными библиотеками, но сначала сосредоточьтесь на этих четырех: NumPy, Pandas, Matplotlib и Seaborn. Сначала ознакомьтесь с ними:
- NumPy: Предоставляет высокопроизводительные многомерные массивы и инструменты для работы с ними.
import numpy as np
обычно используется. - Pandas: наиболее широко используется для обработки данных, предлагая высокоуровневые структуры данных и инструменты для манипулирования.
import pandas as pd
. - Matplotlib: комплексная библиотека для создания статических, анимированных и интерактивных визуализаций, включая графики и графики.
import matplotlib.pyplot as plt
. - Seaborn: библиотека визуализации данных Python на основе Matplotlib, предлагающая высокоуровневые интерфейсы для рисования привлекательной и информативной статистической графики.
import seaborn as sns
.
Для этих библиотек лучшим источником является их официальная документация, оформленная в виде мини-книг с примерами и пояснениями всех параметров. Кроме того, загляните в «Школу данных», где вы найдете отличные онлайн-уроки и советы, которые вы не найдете больше нигде.
Я предоставил ссылки на все источники, обсуждаемые ниже. Приятного обучения!
ссылки и источники изображений:
Изображение1 - https://www.memesmonkey.com/topic/data+science#&gid=1&pid=2
Школа данных — https://www.youtube.com/results?search_query=the+data+school
Telusko- https://www.youtube.com/results?search_query=telusko
Кори- https://www.youtube.com/results?search_query=corey+schafer
Академия Хана — https://www.khanacademy.org/math/statistics-probability
Statquest- https://www.youtube.com/results?search_query=statquest