Свързани публикации 'pandas'


Пътна карта за науката за данни за 2022 г
Искате ли да научите Data Science през 2022 г. безплатно? Тогава трябва да погледнете това ръководство! Добре дошли в друга статия. Днес разглеждаме различни стъпки и свързани ресурси, за да направим началото малко по-лесно дори с нисък бюджет. Както вече знаете, обичам да стигам до същината, без да разказвам много истории. Затова нека направо да се потопим в 💦 Стъпка 1: Python Разбира се, можете също да изберете R, тъй като той също има силни възможности в областта на Data..

Серия Pandas
Серията Pandas е едноизмерен обект, подобен на масив, който може да съдържа много типове данни, като числа или низове, и има опция за предоставяне на етикети на оси. Разлика между NumPy ndarrays и Pandas Series Една от основните разлики между Pandas Series и NumPy ndarrays е, че можете да присвоите индексен етикет на всеки елемент в Pandas Series. С други думи, можете да наименувате индексите на вашата серия Pandas както пожелаете. Друга голяма разлика между Pandas Series и NumPy..

Как да оптимизирам използването на паметта в pandas?
Следват ефективни начини 1. Избиране само на задължителни колони 2. Числови dtypes от по-нисък диапазон 3. Категорични показатели 4.Разредени колони 5.Четене на парчета Техника 1: Избиране на необходимите колони само чрез usecols. df = pd.read_csv("bigcsvfile.csv", usecols=["col1", "col2"]) Техника 2: Свийте цифровите колони с по-малки dtypes int8 can store integers from -128 to 127. int16 can store integers from -32768 to 32767. int64 can..

5 трика на пандите, които вероятно не знаете
Пълният потенциал на Pandas: 5 скрити функции, които всеки специалист по данни трябва да знае Коя е най-важната библиотека в Python за Data Science? Някои може да твърдят, че това е scikit-learn, защото предлага много вградени функции за задачи за машинно обучение. Други може да изберат NumPy за неговите числени операции. Докато дебатът продължава, моят глас отива за Pandas. Защо? Ако не използвате функциите му, операциите ви вероятно ще спрат. Пандите са огромни и има какво да..

Pandas (индексиране и избор).
Python DataFrame е двуизмерна таблична структура от данни с променлив размер и обозначени оси (редове и колони). Pandas DataFrame се състои от три основни компонента, данни , редове и колони. Индексиране в Pandas Пандите имат някои оператори за индексиране. loc и iloc. Използваме тези операции за някакъв вид разширени операции. ВРЪЗКА ЗА НАБОР ДАННИ, Ние ще извършваме всички операции с този набор от данни. Изпуснах колоната Unnamed в набора от данни за..

Най-добрият начин за групиране на данни в Pandas
Не знам за вас, но за мен функцията Groupby на Pandas е най-добрата досега! Не знам за вас, но за мен функцията Groupby на Pandas е най-добрата досега! За всеки, който работи с анализ на данни, съм сигурен, че „Groupby“ трябва да бъде в списъка ви с 5 най-използвани функции! Но тъй като всеки покемон се развива, ще ви разкажа тук начина, по който използвам Groupby и как е изключително гъвкав. Следвайте! Ще използвам Olist Dataset от Kaggle с някои модификации и вече извърших..

Pandas: Порталът за изследване и визуализация на данни
Какво е Pandas? Не съм сигурен дали Pandas е кръстен на много обичаната панда, но Pandas е популярна библиотека на Python с отворен код за манипулиране и анализ на данни. Името произлиза от „панелни данни“. Той предлага различни инструменти за структури от данни и функции при манипулиране на числови данни. Библиотеката включва обект DataFrame за манипулиране на многовариантни данни и обект Series за манипулиране на едномерни данни с интегрирано индексиране. Съществуват различни..