Човешкият мозък обработва изображения 60 000 пъти по-бързо от текст.
Следващата стъпка към това да станете AI/ML гений е да се научите как да представяте вашите данни. С зората на големите данни пред нас, представянето на данни се счита за първия подход за изследване на данни. Дори преди да анализираме данните, трябва да намерим начин да ги представим по-добре.
С това се изкачваме на следващото стъпало на стълбата „Машинно обучение в Python“, тоест данни Визуализация — „Разказване на вашите данни“. В този блог ще разгледаме някои основи на визуализацията с помощта на библиотеките Matplotlib и Seaborn за Python.
Визуализация на данни: Първа стъпка в анализа на данни
Визуализацията на данни е просто представяне на данни и информация в графика, диаграма или друг визуален формат. Това помага при предоставянето на връзки на данните по отношение на изображения. Визуализацията помага за лесно идентифициране на модели и тенденции на набор от данни. Визуализацията на данни е важна не само за учените и анализаторите на данни, тя е необходима във всяка кариера, било то финанси, маркетинг, дизайн или нещо друго.
Визуализацията на данни обаче може не винаги да предоставя ясен резултат от данните. Следователно, трябва да постигнем няколко неща, преди да започнем да работим върху нашите необработени данни:
- Открийте важните променливи в данните.
- Намерете независимите и зависимите променливи.
- Представете данните по начин, по който независимите и зависимите променливи се различават лесно.
Ако изпълним успешно тези задачи, можем директно да определим няколко извода от визуализацията:
- Промени във времето или други зависими променливи
- Честотен брой на променливите
- Връзки или корелации
Matplotlib: Пренесете MATLAB в Python
Matplotlib е мощна библиотека за графиране за Python и неговото числово математическо разширение NumPy. Pyplotе модул Matplotlib, който предоставя подобен на MATLAB интерфейс в Python.
Matplotlib позволява на потребителите да правят 2D фигури с качество на публикация, използвайки своите данни. Да започнем да чертаем!
Анатомия на графиката
Наред с анатомията, нека разгледаме и основните команди в библиотеката Matplotlib.
- Инсталиране на Matplotlib:
Нуждаете се от помощ? Прочетете ме.
pip install matplotlib
- Импортиране на Matplotlib във вашия .py файл:
from matplotlib import pyplot as plt or import matplotlib.pyplot as plt or import matplotlib.pyplot as <alias>
- Създаване на празна фигура:
Фигурата съдържа цялата област, където се извършва чертането. Най-лесният начин да създадете нова фигура с PyPlot:
fig = plt.figure() # A figure with no axes
- Оси на фигура:
Това е, което обикновено смятаме за сюжет. Всяка ос има заглавие, x-етикет и y-етикет.
# Put a title for Axes set_title() # Set x-label set_xlabel() # Set y-label set_ylabel()
- Оси на оси:
Това са подобни на числови линии обекти. Те дават контрол върху границите на графиката, отметките (знаците по оста) и отметките (низовете, обозначаващи отметките) на художник.
# Graph Limits plt.xlim(<start_limit>,<end_limit>) # Limit on x-axis plt.ylim(<start_limit>,<end_limit>) # Limit on y-axis
- Прост сюжет:
# Import the libraries import numpy as np import matplotlib.pyplot as plt x = np.linspace(0, 2, 100) # Defining Data Points plt.plot(x, x, label="linear") # Setting Data Points plt.xlabel('x label') plt.ylabel('y label') plt.title("Simple Plot") plt.legend() # Sets an automatic legend for the plot plt.show() # Displays the plot
- Персонализиране на диаграмата:
Функциятаplt.plot()
може да се използва за определяне на цвета и стила на линията.
x = np.linspace(0,10,1000) y = 2*x # set of default color and style plt.plot(x, np.cos(x)) # RGB tuple, values 0 to 1, solid style plt.plot(x, np.sin(x), color=(1.0,0.2,0.3),linestyle='-') # specify color by name, dashed style plt.plot(x, y, color='blue', linestyle='--') # short color code (rgbcmyk), dotted style plt.plot(x, x+3, color='g',linestyle=':') # Grayscale between 0 and 1, dashdot style plt.plot(x, np.log(x), color='0.75',linestyle='-.') # Hex code (RRGGBB from 00 to FF), dashed style plt.plot(x, x, color='#FFDD44',linestyle='--')
Други функции на Matplotlib можете да прочетете тук.
Ето различните типове графики, които можете да приложите: Визуализация на данни II: Машинно обучение в Python | от Divyansh Chaudhary | януари 2021 г. | Среден
Този блог предоставя познания на начално ниво във вселената на визуализацията на данни. Помага на начинаещите да се запознаят с възможностите за анализ на данни, придобити от използването на библиотеки за визуализация като Matplotlib.
Благодаря, че прочетохте.
Не забравяйте да кликнете върху 👏!