Най-основните инсталации, от които се нуждаете, за да започнете бързо проект за наука за данни

Това лято Apple ми изпрати имейл, защото моята серия Mac имаше „неизправност на батерията“, като ме информира, че трябва да я сменя. Имейлът ме посъветва да направя резервно копие на данните си на твърд диск. В този момент си помислих „леле, това е толкова 2009 г., сега имаме облачно хранилище, каква е нуждата от такова архивиране?“. И тогава се сетих, да, всичките ми данни са в онлайн услуги, но не и софтуерите и конфигурациите, които използвам за ежедневната си работа. Стигнах до предизвикателство: мога ли да направя инсталационен скрипт, за да конфигурирам Mac от нулата, за да работи бързо по проект за наука за данни? Там започна моето пътуване…

Ето списък на всички неща, които считам за основни нужди, които имате, когато работите по такива проекти.

Включих малка изненада в края на тази статия, надявам се да ви хареса!

Управление на версиите на вашия код с Git

Повечето от вас може би са запознати с контрола на версиите и Git. За тези, които не са, тази връзка е много пълно ръководство, за да започнете да използвате Git. Накратко, Git ви дава възможност да работите самостоятелно или в екип върху текстови файлове (кодът е включен в тази категория), с възможност за интелигентно управление на версиите и обединяването на работата, извършена от различните членове на екипа. по същото време.

Това е задължително за всеки проект за развитие. Използването му може да е по-слабо развито в науката за данни (за съжаление), но каквото и да е, ще ви трябва, за да инсталирате някои инструменти, които ще използвате.

Управление на вашите пакети с Homebrew

Homebrew е мениджър на пакети, посветен на MacOS. Това е удобен начин за инсталиране (и деинсталиране) на много полезни пакети. Вече можете просто да изпълните ред във вашия терминал, за да управлявате всеки поддържан пакет (приложения, шрифтове, плъгини, …).

Управление на различни версии на Python без допълнителни разходи с pyenv

Инсталирането и управлението на различни версии на Python на MacOS може да е тромаво. За щастие, pyenv е тук, за да се справи с този проблем. Той дава възможност да инсталирате толкова версии на Python на вашия Mac, колкото искате, и да променяте глобално коя версия да се използва с един ред код по всяко време.

Много е полезно, ако понякога работите върху стар проект, написан на Python 2.7, докато текущият ви проект е на Python 3.6.

Пази ви далеч от бъркотията с virtualenv

Всеки проект, върху който ще работите, ще изисква различни библиотеки на Python, може би дори може би различни версии на една и съща библиотека. За да поддържате инсталацията си чиста и да не губите часове в отстраняване на грешки в библиотеката, трябва да използвате virtualenv, за да създадете изолирана среда на Python, посветена на всеки ваш проект.

Работим върху мощна IDE с отворен код благодарение на VSCodium

Microsoft свърши добра работа, като пусна изходните кодове на VSCode под лиценз на MIT. VSCodium е абсолютно същото нещо като VSCode, но без телеметрията и персонализациите на Microsoft.

VSCodium е много конфигурируем и работи с много голям набор от езици за програмиране и типове файлове.

Този списък може да не е напълно пълен, но се опитах да инвентаризирам основните нужди, когато започнете инсталация от нулата.

Ето малката изненада. Това е bash скрипт, който можете да стартирате на вашата машина, за да инсталирате всички неща, които представих. Това все още е текущ проект, така че може да има нужда от някои корекции. Искам също да благодаря на Haoming, който свърши страхотна работа със своята инсталационна програма за конфигурация на Vim и Oh My Zsh, и ме вдъхнови да започна този малък проект. Използвам неговата програма в моята, тъй като намирам Oh My Zsh за по-приятен от основния Zsh.

Ако имате някакви мисли относно конфигурацията, ако използвате други приложения или пакети, не се колебайте да ги споделите в коментарите!