Публикации по теме 'categorical-data'


Преобразуйте свои категориальные данные с легкостью: руководство по горячему кодированию в машинном обучении
One Hot Encoding: метод обработки категориальных данных в машинном обучении Категориальные данные — это тип данных, состоящий из категорий, а не чисел. Это распространено во многих реальных наборах данных, таких как названия городов, типы продуктов питания и даже категории продуктов. Однако традиционные алгоритмы машинного обучения предназначены для работы с числовыми данными и поэтому не могут напрямую обрабатывать категориальные данные. Одно горячее кодирование — это метод,..

Навигация по проблемам и методам разработки категориальных признаков
«Улучшение представления переменных для машинного обучения» Категорические переменные , также известные как качественные переменные, представляют собой переменные, представляющие отдельные категории или группы, а не числовые значения. Эти переменные часто содержат метки или текстовые данные и играют решающую роль во многих областях, включая социальные науки, маркетинг и машинное обучение. Категориальные переменные создают уникальные проблемы по сравнению с числовыми переменными, в..

Типы переменных для машинного обучения, регрессия и классификация
Узнайте разницу между непрерывными и категориальными данными Вы, вероятно, слышали, что модели машинного обучения могут быть довольно прожорливыми зверями. Нет, я не понимаю, почему они съедают данные.

Вопросы по теме 'categorical-data'

R изменить категориальные данные на фиктивные переменные
У меня есть многовариантный фрейм данных и я хочу преобразовать категориальные данные внутри в фиктивные переменные, я использовал model.matrix, но это не совсем работает. Пожалуйста, обратитесь к примеру ниже: age = c(1:15)...
1975 просмотров
schedule 23.02.2024

Как лучше всего обобщить распределение данных на основе категориальной переменной? Я пытаюсь смоделировать звонки в зависимости от дня недели
У меня есть кадр данных, который содержит дату, день недели (категориальный) и количество вызовов (числовой). Я пытаюсь провести аналитику того, как распределяется объем звонков по дням недели. Используя пакет решетки, я смог создать гистограмму, но...
530 просмотров
schedule 15.06.2024

Как справиться с категоричными особенностями с помощью spark-ml?
Как обрабатывать категориальные данные с помощью spark-ml , а не spark-mllib ? Думал, что документация не очень ясна, кажется, что классификаторы, например. RandomForestClassifier , LogisticRegression , имеют аргумент featuresCol ,...
52713 просмотров

Расширение использования вариантов «Применить» в R
Ранее я задавал вопрос здесь Использование вариантов `apply` в R . Теперь у меня есть расширение на этот вопрос. В моих 40 переменных некоторые переменные являются категориальными. Мне нужно количество наблюдений для каждого уникального качества....
48 просмотров
schedule 17.11.2022

Панды: конвертировать категории в числа
Предположим, у меня есть кадр данных со странами, который выглядит так: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако вместо этого я хочу...
116192 просмотров

scikit научиться дискретизировать категориальные числовые данные
Я пытаюсь дискретизировать данные для классификации. Их значения были строками, и я преобразовал их в числа 0,1,2,3. Вот как выглядят данные (кадр данных pandas). Я разделил фрейм данных на dataLabel и dataFeatures Label Feat1 Feat2...
257 просмотров

Функции OneHotEncoded, вызывающие ошибку при вводе в классификатор
Я пытаюсь подготовить данные для ввода в дерево решений и полиномиальный наивный байесовский классификатор. Вот как выглядят мои данные (фреймворк pandas) Label Feat1 Feat2 Feat3 Feat4 0 1 3 2 1 1 0 1...
521 просмотров

построить категориальную переменную по сравнению с другой категориальной переменной в Python
Каков наилучший способ построить категориальную переменную по сравнению с другой категориальной переменной в Python. Представьте, что у нас есть «мужчины» и «женщины», а с другой стороны, у нас есть «оплачиваемые» и «неоплачиваемые». Как я могу...
1317 просмотров
schedule 02.04.2024

Условный расчет в R на основе значений и категорий строк
У меня есть этот кадр данных: df<-data.frame(a=c("a1","a2","a3","a4","b1","b2","b3","b4","a1","a2","a3","a4","b1","b2","b3","b4"), b=c("x1","x2","x3","total","x1","x2","x3","total", "x1","x2","x3","total","x1","x2","x3","total"),...
914 просмотров

as.type('category') не приводит к желаемому изменению типа данных с 'float64'
Я пытаюсь преобразовать определенный столбец фрейма данных df в категориальный тип данных! или то, что R Programming называет factor . import pandas as pd import numpy as np df = pd.DataFrame(data=np.array([[1,1,2,2,3,3]])) df = df.T...
2831 просмотров

Категориальный график погрешностей по оси X в matplotlib
Я хотел бы построить полосы ошибок с категориальной переменной X. Планки погрешностей (верхняя и нижняя) относятся только к значениям Y. Например, код import numpy as np import matplotlib.pyplot as plt x = ["4", "10", "50"] y = [3, 2, 1] yerr...
1233 просмотров

Как запустить регрессию, которая сообщает обо всех факторных переменных?
Я хочу запустить regression , который вычисляет оценочные значения для всех уровней переменной factor . По умолчанию Stata пропускает один манекен как уровень base . Когда я использую параметр allbaselevels , он просто показывает нулевое...
304 просмотров

Ошибка логистической регрессии: новые уровни в категориальном столбце тестовых данных
Когда я пытался предсказать, используя модель логистической регрессии в R, у меня возникла следующая ошибка: Ошибка pred ‹- предсказать (модель, newdata = test) Ошибка в model.frame.default (Термины, newdata, na.action =...
226 просмотров

Tidyverse: преобразование числовых данных в категориальные данные для построения графиков с неравномерной шириной бункера
Используя tidyverse, я хочу дискретизировать числовые данные с целью использования гистограммы для построения различных числовых диапазонов, как если бы данные были категориальными, путем объявления вручную, где происходят сокращения, например, с...
1464 просмотров
schedule 05.01.2024

Ошибка с пакетом oaxaca в r — несоответствующие аргументы
Я пытаюсь запустить декомпозицию Oaxaca с помощью пакета oaxaca , но включение определенных переменных, по-видимому, вызывает ошибку "несовместимые аргументы". Насколько я могу судить, ошибка возникает только при включении определенных...
176 просмотров
schedule 01.12.2022

В раскрывающемся списке Bokeh выберите ось с данными int и категории
Я строю круговой график ( p.circle ) с использованием боке, обычно следуя примеру фильма с боке. https://docs.bokeh.org/en/latest/docs/gallery.html#gallery Я настроил раскрывающийся виджет, чтобы выбрать ось X: Год (int), Имена (str), Семья...
16 просмотров
schedule 14.11.2023

Добавить процент счета для категориальной переменной в гистограмме; ggplots
Мне нужен кто-то, кто поможет мне отредактировать мой код, чтобы добавить количество процентов в качестве меток столбцов. у меня есть код scandals_deal_breaker <- data[, c("Q19.A: Sexual harassment",...
19 просмотров
schedule 14.04.2024