Самые базовые установки, необходимые для быстрого запуска проекта по науке о данных.
Этим летом Apple отправила мне электронное письмо, потому что в моей серии Mac была неисправность батареи, сообщив мне, что я должен заменить ее. В письме мне посоветовали сделать резервную копию моих данных на жестком диске. В тот момент я подумал вау, это такой 2009 год, теперь у нас есть облачное хранилище, зачем такой бэкап?. И тут я вспомнил, что да, все мои данные находятся в онлайн-сервисах, а не в программах и конфигурациях, которые я использую для своей повседневной работы. Я столкнулся с проблемой: могу ли я создать сценарий установки для настройки Mac с нуля для быстрой работы над проектом по науке о данных? Там началось мое путешествие…
Вот список всех вещей, которые я считаю основными потребностями, которые возникают у вас при работе над такими проектами.
В конце этой статьи я приготовил небольшой сюрприз, надеюсь, вам понравится!
Управление версиями вашего кода с помощью Git
Большинство из вас, возможно, знакомы с контролем версий и Git. Для тех, кто не знает, эта ссылка — очень полное руководство по началу использования Git. Короче говоря, Git дает вам возможность работать в одиночку или в команде над текстовыми файлами (код включен в эту категорию), с возможностью разумного управления версиями и слиянием работы, выполненной разными членами команды. в то же время.
Это обязательное условие для любого девелоперского проекта. Его использование может быть менее развито в науке о данных (к сожалению), но в любом случае он вам понадобится для установки некоторых инструментов, которые вы собираетесь использовать.
Управление пакетами с помощью Homebrew
Homebrew — менеджер пакетов, предназначенный для MacOS. Это удобный способ установить (и удалить) множество полезных пакетов. Теперь вы можете просто выполнить строку в своем терминале для управления любым поддерживаемым пакетом (приложениями, шрифтами, плагинами и т. д.).
Управление различными версиями Python без лишних затрат с помощью pyenv
Установка и управление различными версиями Python в MacOS может быть утомительной. К счастью, pyenv решает эту проблему. Это дает возможность установить столько версий Python на ваш Mac, сколько вам нужно, и глобально изменить используемую версию с помощью одной строки кода в любое время.
Это очень полезно, если вы иногда работаете над старым проектом, написанным на Python 2.7, в то время как ваш текущий проект находится на Python 3.6.
Держите вас подальше от беспорядка с помощью virtualenv
Для каждого проекта, над которым вы собираетесь работать, потребуются разные библиотеки Python, возможно, даже разные версии одной и той же библиотеки. Чтобы ваша установка была чистой и чтобы вы не теряли часы на отладку беспорядка в библиотеке, вы должны использовать virtualenv для создания изолированной среды Python, предназначенной для каждого вашего проекта.
Работа над мощной IDE с открытым исходным кодом благодаря VSCodium
Microsoft хорошо поработала, выпустив исходники VSCode под лицензией MIT. VSCodium — это то же самое, что и VSCode, но без телеметрии и кастомизации Microsoft.
VSCodium обладает широкими возможностями настройки и работает с большим количеством языков программирования и типов файлов.
Этот список может быть неполным, но я старался изо всех сил перечислить основные потребности, когда вы начинаете установку с нуля.
Вот небольшой сюрприз. Это bash-скрипт, который вы можете запустить на своем компьютере, чтобы установить все, что я представил. Это все еще текущий проект, поэтому могут потребоваться некоторые корректировки. Я также хочу поблагодарить Haoming, который отлично справился со своей программой установки для настройки Vim и Oh My Zsh, и вдохновил меня начать этот небольшой проект. Я использую его программу в своей, так как нахожу Oh My Zsh более приятной, чем базовая Zsh.
Если у вас есть какие-либо мысли о конфигурации, если вы используете другие приложения или пакеты, не стесняйтесь поделиться ими в комментариях!