Използване на Modin за по-бърза работа на Pandas
Всички трябва да сме се сблъсквали с панди в нашето пътешествие в Data Science. Това е една от най-използваните библиотеки на Python, която помага при извършването на различни операции като анализиране на данни, създаване на визуализации на данни, извършване на статистически операции и т.н.
Но Pandas може да бъде малко бавен, ако имаме работа с големи набори от данни, отнема време за зареждане на тези данни и извършване на операции върху тях. И така, как да го направим по-бързо за големи набори от данни? Можем да използваме Modin, която е библиотека на Python с отворен код, за да ускорим библиотеката Pandas.
В тази статия ще проучим как да използваме Modin и ще го сравним с Pandas.
Да започваме…
Инсталиране на необходимите библиотеки
Ще започнем с инсталирането на Modin с помощта на pip. Командата, дадена по-долу, ще направи това.
!pip install modin[dask]
Импортиране на необходимите библиотеки
В тази стъпка ще импортираме необходимите библиотеки, Pandas и Modin, защото ще сравняваме времето, необходимо на двете за зареждане на набор от данни.
import modin.pandas as mpd import pandas as pd
Сравняване на Pandas & Modin
В тази стъпка ще заредим набора от данни, като използваме както Pandas, така и Modin, за да сравним времето, необходимо и на двете. Можете да използвате всеки набор от данни за това. Използвам известния набор от данни за диабета за това.
%%time df1 = pd.read_csv("/content/Diabetes.csv")
%%time df2 = mpd.read_csv("/content/Diabetes.csv")
Виждате как Modin отнема по-малко време за зареждане на набора от данни, по същия начин ще спести време и при извършването на всички други операции.
Продължете, опитайте това с различни набори от данни и изпълнете операции с pandas с помощта на Modin и спестете време. В случай, че срещнете затруднения, моля, уведомете ме в раздела за отговори.
Тази статия е в сътрудничество с Пиюш Ингале.
Преди да тръгнеш
Благодаря, че прочетохте! Ако искате да се свържете с мен, можете да се свържете с мен на [email protected] или на моя Профил в LinkedIn. Можете да видите моя профил в Github за различни проекти за наука за данни и уроци за пакети. Освен това не се колебайте да разгледате моя профил и да прочетете различни статии, които съм написал, свързани с Data Science.