Самые базовые установки, необходимые для быстрого запуска проекта по науке о данных.

Этим летом Apple отправила мне электронное письмо, потому что в моей серии Mac была неисправность батареи, сообщив мне, что я должен заменить ее. В письме мне посоветовали сделать резервную копию моих данных на жестком диске. В тот момент я подумал вау, это такой 2009 год, теперь у нас есть облачное хранилище, зачем такой бэкап?. И тут я вспомнил, что да, все мои данные находятся в онлайн-сервисах, а не в программах и конфигурациях, которые я использую для своей повседневной работы. Я столкнулся с проблемой: могу ли я создать сценарий установки для настройки Mac с нуля для быстрой работы над проектом по науке о данных? Там началось мое путешествие…

Вот список всех вещей, которые я считаю основными потребностями, которые возникают у вас при работе над такими проектами.

В конце этой статьи я приготовил небольшой сюрприз, надеюсь, вам понравится!

Управление версиями вашего кода с помощью Git

Большинство из вас, возможно, знакомы с контролем версий и Git. Для тех, кто не знает, эта ссылка — очень полное руководство по началу использования Git. Короче говоря, Git дает вам возможность работать в одиночку или в команде над текстовыми файлами (код включен в эту категорию), с возможностью разумного управления версиями и слиянием работы, выполненной разными членами команды. в то же время.

Это обязательное условие для любого девелоперского проекта. Его использование может быть менее развито в науке о данных (к сожалению), но в любом случае он вам понадобится для установки некоторых инструментов, которые вы собираетесь использовать.

Управление пакетами с помощью Homebrew

Homebrew — менеджер пакетов, предназначенный для MacOS. Это удобный способ установить (и удалить) множество полезных пакетов. Теперь вы можете просто выполнить строку в своем терминале для управления любым поддерживаемым пакетом (приложениями, шрифтами, плагинами и т. д.).

Управление различными версиями Python без лишних затрат с помощью pyenv

Установка и управление различными версиями Python в MacOS может быть утомительной. К счастью, pyenv решает эту проблему. Это дает возможность установить столько версий Python на ваш Mac, сколько вам нужно, и глобально изменить используемую версию с помощью одной строки кода в любое время.

Это очень полезно, если вы иногда работаете над старым проектом, написанным на Python 2.7, в то время как ваш текущий проект находится на Python 3.6.

Держите вас подальше от беспорядка с помощью virtualenv

Для каждого проекта, над которым вы собираетесь работать, потребуются разные библиотеки Python, возможно, даже разные версии одной и той же библиотеки. Чтобы ваша установка была чистой и чтобы вы не теряли часы на отладку беспорядка в библиотеке, вы должны использовать virtualenv для создания изолированной среды Python, предназначенной для каждого вашего проекта.

Работа над мощной IDE с открытым исходным кодом благодаря VSCodium

Microsoft хорошо поработала, выпустив исходники VSCode под лицензией MIT. VSCodium — это то же самое, что и VSCode, но без телеметрии и кастомизации Microsoft.

VSCodium обладает широкими возможностями настройки и работает с большим количеством языков программирования и типов файлов.

Этот список может быть неполным, но я старался изо всех сил перечислить основные потребности, когда вы начинаете установку с нуля.

Вот небольшой сюрприз. Это bash-скрипт, который вы можете запустить на своем компьютере, чтобы установить все, что я представил. Это все еще текущий проект, поэтому могут потребоваться некоторые корректировки. Я также хочу поблагодарить Haoming, который отлично справился со своей программой установки для настройки Vim и Oh My Zsh, и вдохновил меня начать этот небольшой проект. Я использую его программу в своей, так как нахожу Oh My Zsh более приятной, чем базовая Zsh.

Если у вас есть какие-либо мысли о конфигурации, если вы используете другие приложения или пакеты, не стесняйтесь поделиться ими в комментариях!