В днешния бързо развиващ се свят Data Science се превърна в бъдещето и компаниите правят значителни инвестиции в тази област. Машинното обучение, дълбокото обучение и компютърното зрение са някои от модерните технологии, от които всеки иска да участва. Но как да започнете това безкрайно пътуване? В тази статия ще обясня най-добрите източници и материали, които със сигурност ще ви помогнат да разберете по-дълбоките концепции. Освен това се опитах да включа възможно най-много безплатни източници, за да направя обучението достъпно за всички.

Преди да се заровим в ресурсите, бих искал да спомена няколко важни неща, които трябва да следвате:

  1. Математиката е от решаващо значение: Честно казано, Data Science е свързана изцяло със статистика. Ако смятате, че можете да пропуснете изучаването на математиката зад това и директно да започнете да кодирате, като копирате хранилищата на GitHub, съжалявам, но това пътуване може да не е подходящо за вас.
  2. Разбиране на стойността пред сертификатите: Сертификатите са страхотни, но не бягайте зад тях сляпо. Завършването на курс без истинско разбиране на концепциите няма да ви отведе далеч. Научете и разберете материала и вашите проекти ще говорят вместо вас.
  3. Спрете да бягате зад сертификати:Знам, че всички обичате сертификатите и колко много означават те за вас, но мислили ли сте някога каква е целта на такова постижение, което дори не знаете добре? току-що завършихте 5-седмичен курс, като пропуснахте видеоклипове или изпратихте копирани задания, започнете да учите и разбирате първо вашите проекти ще говорят вместо вас

Статистика и математика:

Ако приемем, че имате основна представа за статистика, като например „Това е клон на математиката, който се занимава със събиране и анализиране на числени данни в големи количества“, можете да започнете с Khan Academy. Това е безплатна платформа за обучение, предлагаща курс по статистика и вероятност, който обхваща всичко от основите до темите за напреднали. Платформата прави ученето забавно и ангажиращо с уникална среда в стил игра, викторини и предизвикателства.

Освен това можете да се обърнете към StatQuest, YouTube канал на Джош Стармър, който опростява сложни концепции като P-стойности, като ви дава представа защо изучаването на статистика е от съществено значение.

Програмиране на Python:

Ако имате предишен опит в кодирането на езици като C, C++ или Java, изучаването на Python ще бъде относително лесно. Но дори и да сте напълно начинаещ, Python е най-лесният и ефективен език, с който да започнете. Препоръчителна книга за изучаване на Python е „Python Crash Course“. Той обхваща основни команди на Python, OOP концепции, работа с файлове и предлага практическа практика, при която ще изградите своя собствена игра на Python, като използвате различни концепции за програмиране.

Ако предпочитате онлайн видео уроци, вижте „Telusko“ и „Corey Schafer“ в YouTube. Както програмистите на Python, така и потребителите на YouTube, те обясняват всяка концепция по страхотен начин.

Jupyter Notebook и iPython:

За кодиране в Python силно препоръчвам да използвате Jupyter Notebook. Той е удобен за потребителя и всяка команда се изпълнява в отделни клетки. Можете да получите достъп до документация с примери в клетката, като използвате Shift + Tab и автоматично довършване на предварително дефинирани функции или променливи с клавиша Tab. Малко проучване от официалната документация или YouTube ще бъде достатъчно, за да започнете.

Библиотеки на Python за наука за данни:

Докато напредвате, ще срещнете различни библиотеки, но първоначално се съсредоточете върху тези четири: NumPy, Pandas, Matplotlib и Seaborn. Първо се запознайте с тях:

  • NumPy: Предоставя високопроизводителни многоизмерни масиви и инструменти за работа с тях. import numpy as np се използва често.
  • Pandas: Най-широко използвани за събиране на данни, предлагащи структури от данни на високо ниво и инструменти за манипулиране. import pandas as pd.
  • Matplotlib: Изчерпателна библиотека за създаване на статични, анимирани и интерактивни визуализации, включително графики и графики. import matplotlib.pyplot as plt.
  • Seaborn: Библиотека за визуализация на данни на Python, базирана на Matplotlib, предлагаща интерфейси от високо ниво за рисуване на атрактивни и информативни статистически графики. import seaborn as sns.

За тези библиотеки най-добрият източник е тяхната официална документация, проектирана като мини-книги с примери и обяснения на всички параметри. Освен това вижте „The Data School“ за отлични онлайн уроци и съвети, които няма да намерите другаде.

Предоставих връзки към всички източници, обсъдени по-долу. Приятно учене!

връзки и източници на изображения:

Изображение1 -https://www.memesmonkey.com/topic/data+science#&gid=1&pid=2

Училище за данни — https://www.youtube.com/results?search_query=the+data+school

Telusko- https://www.youtube.com/results?search_query=telusko

Кори- https://www.youtube.com/results?search_query=corey+schafer

Khan academy — https://www.khanacademy.org/math/statistics-probability

Statquest- https://www.youtube.com/results?search_query=statquest