Публикации по теме 'categorical-data'
Преобразуйте свои категориальные данные с легкостью: руководство по горячему кодированию в машинном обучении
One Hot Encoding: метод обработки категориальных данных в машинном обучении
Категориальные данные — это тип данных, состоящий из категорий, а не чисел. Это распространено во многих реальных наборах данных, таких как названия городов, типы продуктов питания и даже категории продуктов. Однако традиционные алгоритмы машинного обучения предназначены для работы с числовыми данными и поэтому не могут напрямую обрабатывать категориальные данные.
Одно горячее кодирование — это метод,..
Навигация по проблемам и методам разработки категориальных признаков
«Улучшение представления переменных для машинного обучения»
Категорические переменные , также известные как качественные переменные, представляют собой переменные, представляющие отдельные категории или группы, а не числовые значения. Эти переменные часто содержат метки или текстовые данные и играют решающую роль во многих областях, включая социальные науки, маркетинг и машинное обучение.
Категориальные переменные создают уникальные проблемы по сравнению с числовыми переменными, в..
Типы переменных для машинного обучения, регрессия и классификация
Узнайте разницу между непрерывными и категориальными данными
Вы, вероятно, слышали, что модели машинного обучения могут быть довольно прожорливыми зверями.
Нет, я не понимаю, почему они съедают данные.
Вопросы по теме 'categorical-data'
R изменить категориальные данные на фиктивные переменные
У меня есть многовариантный фрейм данных и я хочу преобразовать категориальные данные внутри в фиктивные переменные, я использовал model.matrix, но это не совсем работает. Пожалуйста, обратитесь к примеру ниже:
age = c(1:15)...
1975 просмотров
schedule
23.02.2024
Как лучше всего обобщить распределение данных на основе категориальной переменной? Я пытаюсь смоделировать звонки в зависимости от дня недели
У меня есть кадр данных, который содержит дату, день недели (категориальный) и количество вызовов (числовой). Я пытаюсь провести аналитику того, как распределяется объем звонков по дням недели. Используя пакет решетки, я смог создать гистограмму, но...
530 просмотров
schedule
15.06.2024
Как справиться с категоричными особенностями с помощью spark-ml?
Как обрабатывать категориальные данные с помощью spark-ml , а не spark-mllib ?
Думал, что документация не очень ясна, кажется, что классификаторы, например. RandomForestClassifier , LogisticRegression , имеют аргумент featuresCol ,...
52713 просмотров
schedule
29.03.2024
Расширение использования вариантов «Применить» в R
Ранее я задавал вопрос здесь Использование вариантов `apply` в R . Теперь у меня есть расширение на этот вопрос. В моих 40 переменных некоторые переменные являются категориальными. Мне нужно количество наблюдений для каждого уникального качества....
48 просмотров
schedule
17.11.2022
Панды: конвертировать категории в числа
Предположим, у меня есть кадр данных со странами, который выглядит так:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако вместо этого я хочу...
116192 просмотров
schedule
29.11.2023
scikit научиться дискретизировать категориальные числовые данные
Я пытаюсь дискретизировать данные для классификации. Их значения были строками, и я преобразовал их в числа 0,1,2,3.
Вот как выглядят данные (кадр данных pandas). Я разделил фрейм данных на dataLabel и dataFeatures
Label Feat1 Feat2...
257 просмотров
schedule
04.01.2024
Функции OneHotEncoded, вызывающие ошибку при вводе в классификатор
Я пытаюсь подготовить данные для ввода в дерево решений и полиномиальный наивный байесовский классификатор.
Вот как выглядят мои данные (фреймворк pandas)
Label Feat1 Feat2 Feat3 Feat4
0 1 3 2 1
1 0 1...
521 просмотров
schedule
12.01.2024
построить категориальную переменную по сравнению с другой категориальной переменной в Python
Каков наилучший способ построить категориальную переменную по сравнению с другой категориальной переменной в Python. Представьте, что у нас есть «мужчины» и «женщины», а с другой стороны, у нас есть «оплачиваемые» и «неоплачиваемые». Как я могу...
1317 просмотров
schedule
02.04.2024
Условный расчет в R на основе значений и категорий строк
У меня есть этот кадр данных:
df<-data.frame(a=c("a1","a2","a3","a4","b1","b2","b3","b4","a1","a2","a3","a4","b1","b2","b3","b4"), b=c("x1","x2","x3","total","x1","x2","x3","total", "x1","x2","x3","total","x1","x2","x3","total"),...
914 просмотров
schedule
08.12.2023
as.type('category') не приводит к желаемому изменению типа данных с 'float64'
Я пытаюсь преобразовать определенный столбец фрейма данных df в категориальный тип данных! или то, что R Programming называет factor .
import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.array([[1,1,2,2,3,3]]))
df = df.T...
2831 просмотров
schedule
27.11.2023
Категориальный график погрешностей по оси X в matplotlib
Я хотел бы построить полосы ошибок с категориальной переменной X. Планки погрешностей (верхняя и нижняя) относятся только к значениям Y.
Например, код
import numpy as np
import matplotlib.pyplot as plt
x = ["4", "10", "50"]
y = [3, 2, 1]
yerr...
1233 просмотров
schedule
28.01.2024
Как запустить регрессию, которая сообщает обо всех факторных переменных?
Я хочу запустить regression , который вычисляет оценочные значения для всех уровней переменной factor . По умолчанию Stata пропускает один манекен как уровень base .
Когда я использую параметр allbaselevels , он просто показывает нулевое...
304 просмотров
schedule
13.10.2022
Ошибка логистической регрессии: новые уровни в категориальном столбце тестовых данных
Когда я пытался предсказать, используя модель логистической регрессии в R, у меня возникла следующая ошибка:
Ошибка
pred ‹- предсказать (модель, newdata = test) Ошибка в model.frame.default (Термины, newdata, na.action =...
226 просмотров
schedule
30.12.2023
Tidyverse: преобразование числовых данных в категориальные данные для построения графиков с неравномерной шириной бункера
Используя tidyverse, я хочу дискретизировать числовые данные с целью использования гистограммы для построения различных числовых диапазонов, как если бы данные были категориальными, путем объявления вручную, где происходят сокращения, например, с...
1464 просмотров
schedule
05.01.2024
Ошибка с пакетом oaxaca в r — несоответствующие аргументы
Я пытаюсь запустить декомпозицию Oaxaca с помощью пакета oaxaca , но включение определенных переменных, по-видимому, вызывает ошибку "несовместимые аргументы". Насколько я могу судить, ошибка возникает только при включении определенных...
176 просмотров
schedule
01.12.2022
В раскрывающемся списке Bokeh выберите ось с данными int и категории
Я строю круговой график ( p.circle ) с использованием боке, обычно следуя примеру фильма с боке.
https://docs.bokeh.org/en/latest/docs/gallery.html#gallery
Я настроил раскрывающийся виджет, чтобы выбрать ось X: Год (int), Имена (str), Семья...
16 просмотров
schedule
14.11.2023
Добавить процент счета для категориальной переменной в гистограмме; ggplots
Мне нужен кто-то, кто поможет мне отредактировать мой код, чтобы добавить количество процентов в качестве меток столбцов.
у меня есть код
scandals_deal_breaker <- data[, c("Q19.A: Sexual harassment",...
19 просмотров
schedule
14.04.2024