В днешния бързо развиващ се свят Data Science се превърна в бъдещето и компаниите правят значителни инвестиции в тази област. Машинното обучение, дълбокото обучение и компютърното зрение са някои от модерните технологии, от които всеки иска да участва. Но как да започнете това безкрайно пътуване? В тази статия ще обясня най-добрите източници и материали, които със сигурност ще ви помогнат да разберете по-дълбоките концепции. Освен това се опитах да включа възможно най-много безплатни източници, за да направя обучението достъпно за всички.
Преди да се заровим в ресурсите, бих искал да спомена няколко важни неща, които трябва да следвате:
- Математиката е от решаващо значение: Честно казано, Data Science е свързана изцяло със статистика. Ако смятате, че можете да пропуснете изучаването на математиката зад това и директно да започнете да кодирате, като копирате хранилищата на GitHub, съжалявам, но това пътуване може да не е подходящо за вас.
- Разбиране на стойността пред сертификатите: Сертификатите са страхотни, но не бягайте зад тях сляпо. Завършването на курс без истинско разбиране на концепциите няма да ви отведе далеч. Научете и разберете материала и вашите проекти ще говорят вместо вас.
- Спрете да бягате зад сертификати:Знам, че всички обичате сертификатите и колко много означават те за вас, но мислили ли сте някога каква е целта на такова постижение, което дори не знаете добре? току-що завършихте 5-седмичен курс, като пропуснахте видеоклипове или изпратихте копирани задания, започнете да учите и разбирате първо вашите проекти ще говорят вместо вас
Статистика и математика:
Ако приемем, че имате основна представа за статистика, като например „Това е клон на математиката, който се занимава със събиране и анализиране на числени данни в големи количества“, можете да започнете с Khan Academy. Това е безплатна платформа за обучение, предлагаща курс по статистика и вероятност, който обхваща всичко от основите до темите за напреднали. Платформата прави ученето забавно и ангажиращо с уникална среда в стил игра, викторини и предизвикателства.
Освен това можете да се обърнете към StatQuest, YouTube канал на Джош Стармър, който опростява сложни концепции като P-стойности, като ви дава представа защо изучаването на статистика е от съществено значение.
Програмиране на Python:
Ако имате предишен опит в кодирането на езици като C, C++ или Java, изучаването на Python ще бъде относително лесно. Но дори и да сте напълно начинаещ, Python е най-лесният и ефективен език, с който да започнете. Препоръчителна книга за изучаване на Python е „Python Crash Course“. Той обхваща основни команди на Python, OOP концепции, работа с файлове и предлага практическа практика, при която ще изградите своя собствена игра на Python, като използвате различни концепции за програмиране.
Ако предпочитате онлайн видео уроци, вижте „Telusko“ и „Corey Schafer“ в YouTube. Както програмистите на Python, така и потребителите на YouTube, те обясняват всяка концепция по страхотен начин.
Jupyter Notebook и iPython:
За кодиране в Python силно препоръчвам да използвате Jupyter Notebook. Той е удобен за потребителя и всяка команда се изпълнява в отделни клетки. Можете да получите достъп до документация с примери в клетката, като използвате Shift + Tab и автоматично довършване на предварително дефинирани функции или променливи с клавиша Tab. Малко проучване от официалната документация или YouTube ще бъде достатъчно, за да започнете.
Библиотеки на Python за наука за данни:
Докато напредвате, ще срещнете различни библиотеки, но първоначално се съсредоточете върху тези четири: NumPy, Pandas, Matplotlib и Seaborn. Първо се запознайте с тях:
- NumPy: Предоставя високопроизводителни многоизмерни масиви и инструменти за работа с тях.
import numpy as np
се използва често. - Pandas: Най-широко използвани за събиране на данни, предлагащи структури от данни на високо ниво и инструменти за манипулиране.
import pandas as pd
. - Matplotlib: Изчерпателна библиотека за създаване на статични, анимирани и интерактивни визуализации, включително графики и графики.
import matplotlib.pyplot as plt
. - Seaborn: Библиотека за визуализация на данни на Python, базирана на Matplotlib, предлагаща интерфейси от високо ниво за рисуване на атрактивни и информативни статистически графики.
import seaborn as sns
.
За тези библиотеки най-добрият източник е тяхната официална документация, проектирана като мини-книги с примери и обяснения на всички параметри. Освен това вижте „The Data School“ за отлични онлайн уроци и съвети, които няма да намерите другаде.
Предоставих връзки към всички източници, обсъдени по-долу. Приятно учене!
връзки и източници на изображения:
Изображение1 -https://www.memesmonkey.com/topic/data+science#&gid=1&pid=2
Училище за данни — https://www.youtube.com/results?search_query=the+data+school
Telusko- https://www.youtube.com/results?search_query=telusko
Кори- https://www.youtube.com/results?search_query=corey+schafer
Khan academy — https://www.khanacademy.org/math/statistics-probability
Statquest- https://www.youtube.com/results?search_query=statquest