О нас:

Сегментированный одномерный анализ — одна из самых простых форм визуализации для анализа данных. В своем названии «Uni» означает тот, который сам описывает, что он рассматривает только одну переменную данных для анализа. анализ. Сегментный анализ здесь означает, что переменная данных анализируется в подмножествах, и это очень полезно, поскольку может показать метрику изменения в шаблоне для разных сегментов одной и той же переменной.

Он рассматривает одну переменную за раз, например, данные, показанные ниже в частоте, могут использоваться для одномерного анализа. В этом примере показано количество продаж различных товаров в медицинском магазине.

Приложение:

Сегментированный одномерный анализ можно использовать для поиска сводки одной переменной данных в виде сегментов. Переменная набора данных делится на подмножества, и в сегментах можно наблюдать закономерности. Центральные тенденции, такие как среднее, мода и медиана; максимум и минимум; спектр; также обнаруживаются дисперсия и стандартное отклонение. Для отображения описания используются визуализированные диаграммы различного вида.

Пример:

В качестве примера можно привести набор данных о продавце лекарств, который показывает, какой тип наркотиков предоставляется какому покупателю. Наша цель — создать визуализацию для просмотра различных категорий уровня холестерина. Это поможет нам в анализе путем создания различных типов диаграмм визуализации.

Ввод:

В ATH для запуска функции выберите столбцы данных и используйте путь:

Визуализация данных => Расширенные диаграммы => Сегментированный одномерный анализ (Py) для запуска функции.

Пользователю необходимо указать следующие данные, которые поступают в качестве входных данных для функции.

Целевой столбец: выберите целевой столбец
Тип проблемы:выберите тип проблемы, классификацию или регрессию
Числовая переменная (необязательно): Выберите числовые переменные, если вы хотите указать dtype вручную
Категорическая переменная (необязательно): Выберите категориальную переменную, если вы хотите указать dtype вручную

Вывод и интерпретация:

Вывод различается для столбцов категорийных и числовых данных: круговая диаграмма и столбчатая диаграмма для описания категориальной переменной, гистограмма и прямоугольная диаграмма для описания числовой переменной. Ниже приведен вывод как для числовых, так и для категориальных столбцов данных.

График для задачи классификации. На выходе функции будет отображаться круговая диаграмма и тепловая карта по отношению к целевой переменной. Этот вывод предназначен для категориальной переменной данных.

На выходе функции будет отображаться гистограмма, прямоугольная диаграмма и реляционная гистограмма, прямоугольная диаграмма относительно целевой переменной. Этот вывод предназначен для числовой переменной данных.

График для задачи регрессии:задача регрессии требует, чтобы целевая переменная имела числовой тип dtype.

Этот вывод функции предназначен для категориальной переменной и будет отображать круговую диаграмму и сравнительную гистограмму для представления сегментированного анализа.

Этот вывод относится к числовой переменной и будет отображать гистограмму, коробчатую диаграмму и точечную диаграмму по отношению к целевой переменной.

Попробуйте ATH Leaps, чтобы узнать о других замечательных функциях.