Човешкият мозък обработва изображения 60 000 пъти по-бързо от текст.

Следващата стъпка към това да станете AI/ML гений е да се научите как да представяте вашите данни. С зората на големите данни пред нас, представянето на данни се счита за първия подход за изследване на данни. Дори преди да анализираме данните, трябва да намерим начин да ги представим по-добре.
С това се изкачваме на следващото стъпало на стълбата „Машинно обучение в Python“, тоест данни Визуализация — „Разказване на вашите данни“. В този блог ще разгледаме някои основи на визуализацията с помощта на библиотеките Matplotlib и Seaborn за Python.

Визуализация на данни: Първа стъпка в анализа на данни

Визуализацията на данни е просто представяне на данни и информация в графика, диаграма или друг визуален формат. Това помага при предоставянето на връзки на данните по отношение на изображения. Визуализацията помага за лесно идентифициране на модели и тенденции на набор от данни. Визуализацията на данни е важна не само за учените и анализаторите на данни, тя е необходима във всяка кариера, било то финанси, маркетинг, дизайн или нещо друго.
Визуализацията на данни обаче може не винаги да предоставя ясен резултат от данните. Следователно, трябва да постигнем няколко неща, преди да започнем да работим върху нашите необработени данни:

  • Открийте важните променливи в данните.
  • Намерете независимите и зависимите променливи.
  • Представете данните по начин, по който независимите и зависимите променливи се различават лесно.

Ако изпълним успешно тези задачи, можем директно да определим няколко извода от визуализацията:

  • Промени във времето или други зависими променливи
  • Честотен брой на променливите
  • Връзки или корелации

Matplotlib: Пренесете MATLAB в Python

Matplotlib е мощна библиотека за графиране за Python и неговото числово математическо разширение NumPy. Pyplotе модул Matplotlib, който предоставя подобен на MATLAB интерфейс в Python.

Matplotlib позволява на потребителите да правят 2D фигури с качество на публикация, използвайки своите данни. Да започнем да чертаем!

Анатомия на графиката

Наред с анатомията, нека разгледаме и основните команди в библиотеката Matplotlib.

pip install matplotlib
  • Импортиране на Matplotlib във вашия .py файл:
from matplotlib import pyplot as plt
or
import matplotlib.pyplot as plt
or
import matplotlib.pyplot as <alias>
  • Създаване на празна фигура:
    Фигурата съдържа цялата област, където се извършва чертането. Най-лесният начин да създадете нова фигура с PyPlot:
fig = plt.figure() # A figure with no axes
  • Оси на фигура:
    Това е, което обикновено смятаме за сюжет. Всяка ос има заглавие, x-етикет и y-етикет.

# Put a title for Axes
set_title()
# Set x-label
set_xlabel()
# Set y-label
set_ylabel()
  • Оси на оси:
    Това са подобни на числови линии обекти. Те дават контрол върху границите на графиката, отметките (знаците по оста) и отметките (низовете, обозначаващи отметките) на художник.
# Graph Limits
plt.xlim(<start_limit>,<end_limit>) # Limit on x-axis
plt.ylim(<start_limit>,<end_limit>) # Limit on y-axis
  • Прост сюжет:
# Import the libraries
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(0, 2, 100) # Defining Data Points
plt.plot(x, x, label="linear") # Setting Data Points
plt.xlabel('x label')
plt.ylabel('y label')

plt.title("Simple Plot")
plt.legend() # Sets an automatic legend for the plot

plt.show() # Displays the plot
  • Персонализиране на диаграмата:
    Функцията plt.plot()може да се използва за определяне на цвета и стила на линията.
x = np.linspace(0,10,1000)
y = 2*x
# set of default color and style
plt.plot(x, np.cos(x))
# RGB tuple, values 0 to 1, solid style
plt.plot(x, np.sin(x), color=(1.0,0.2,0.3),linestyle='-')
# specify color by name, dashed style
plt.plot(x, y, color='blue', linestyle='--')
# short color code (rgbcmyk), dotted style   
plt.plot(x, x+3, color='g',linestyle=':')
# Grayscale between 0 and 1, dashdot style    
plt.plot(x, np.log(x), color='0.75',linestyle='-.')
# Hex code (RRGGBB from 00 to FF), dashed style  
plt.plot(x, x, color='#FFDD44',linestyle='--')

Други функции на Matplotlib можете да прочетете тук.

Ето различните типове графики, които можете да приложите: Визуализация на данни II: Машинно обучение в Python | от Divyansh Chaudhary | януари 2021 г. | Среден

Този блог предоставя познания на начално ниво във вселената на визуализацията на данни. Помага на начинаещите да се запознаят с възможностите за анализ на данни, придобити от използването на библиотеки за визуализация като Matplotlib.

Благодаря, че прочетохте.
Не забравяйте да кликнете върху 👏!