Свързани публикации 'data-engineering'


Прост скрипт на Python, който ми позволява да спестявам повече от 20 хиляди годишно
Как да използвате Python за конвертиране на бюджетна електронна таблица в динамична функция на Python. Най-доброто приложение на Python: спестяване на пари Разбрах през 2022 г.: Въпреки че имам приложение за банкиране и „проследяване на разходите (Mint)“, жена ми и аз никога не съзнателно...

Как: Внедряване на дървета на решения в Python със Scikit-Learn (част 3)
В тази публикация в блога ще преминем през ръководство стъпка по стъпка за това как да внедрим дървета на решения в Python с помощта на библиотеката scikit-learn. Нека използваме подходящ пример: наборът от данни Iris, класика в областта на машинното обучение, който съдържа измервания за 150 цветя на ирис от три различни вида. Преди да започнем, уверете се, че имате инсталирани необходимите библиотеки. Можете да направите това, като използвате pip, програмата за инсталиране на пакети..

Защо трябва да започнете да изследвате TabPy
TabPy е разширение за анализ от Tableau, което позволява на потребителите да изпълняват Python скриптове и запазени функции с помощта на Tableau. С TabPy можем да изпълняваме Python Script в движение и да показваме резултатите като визуализация. Също така е възможно да се контролират данните, изпратени до TabPy чрез взаимодействие с работния лист Tableau и таблото за управление чрез параметрите.

Овластяване на селското стопанство с наука за данни и дронове
Ролята на науката за данните в селското стопанство е ключова. Той дава възможност на фермерите и заинтересованите страни с прозрения, базирани на данни, за вземане на информирани решения. Приложенията включват прогнозиране на реколтата, откриване на болести, прецизно земеделие и оптимизиране на веригата за доставки. Чрез анализиране на исторически данни и данни в реално време науката за данните помага за оптимизиране на напояването, торенето и контрола на вредителите. Предложенията..

🎯Предизвикателство в Pyspark: Анализиране на данни за продажби от електронна търговия
🎯Pyspark Challenge: Анализиране на данните за продажбите в електронната търговия 🔎История: Вие работите за компания за електронна търговия и те са ви предоставили набор от данни, съдържащ информация за техните продажби. Вашата задача е да извършвате различни трансформации на данни с помощта на PySpark, за да генерирате прозрения. 📊Примерни данни: | ID_на_поръчка | customer_id | дата_на_поръчка | product_id | количество | цена | |----------|-------------|------------|-----..

Съвети към начинаещи инженери по данни.
Съвети към начинаещи инженери по данни. Попаднах на някои интересни въпроси в множество форуми като интервюта, общи дискусии и уебинари. Мислех да сложа моя прием- Que- Какво е инженер по данни и какво правят? Ans-A инженер по данни е техническо лице, което отговаря за архитектурата, изграждането, тестването и поддръжката на системата за данни. Те са отговорни за намирането на последните тенденции в наборите от данни и създаването на ефективни алгоритми, за да направят данните..

Вълнуващо начало на AWS SageMaker
Здравейте, начинаещи хора от AWS на друг прост, но много полезен пример, който измислих за AWS Sagemaker. Тази публикация отново ще се счита за въведение за AWS SageMaker като предишната ми публикация, но планирам да си изцапам ръцете, опитвайки се да разположа един прост ml модел като по-технически, включително личния ми опит с AWS SageMaker многооооооооооооооооооооооооооооооооооооно В предишния си блог се опитах да дам кратко въведение за какво служи AWS SageMaker и защо е толкова..