Вопросы по теме 'sklearn-pandas'
scikit научиться дискретизировать категориальные числовые данные
Я пытаюсь дискретизировать данные для классификации. Их значения были строками, и я преобразовал их в числа 0,1,2,3.
Вот как выглядят данные (кадр данных pandas). Я разделил фрейм данных на dataLabel и dataFeatures
Label Feat1 Feat2...
257 просмотров
schedule
04.01.2024
ValueError: этому решателю нужны образцы как минимум 2 классов в данных, но данные содержат только один класс: 0.0
Я применил логистическую регрессию к набору поездов после разделения набора данных на наборы тестов и поездов, но получил указанную выше ошибку. Я попытался разобраться, и когда я попытался напечатать свой вектор ответа y_train в консоли, он печатает...
21461 просмотров
schedule
06.02.2024
Доступ к строкам по целым числам и столбцам по меткам Pandas
Мои данные такие:
[Первая строка — заголовки]
Name,Email,Age
Sachith,[email protected],23
Sim,[email protected],234
Yoshi,[email protected],2345
sarla,[email protected],234
Я хотел бы получить доступ к элементам, чтобы строки были указаны как целые...
7558 просмотров
schedule
14.10.2022
Вычисление матриц путаницы
В настоящее время я вычисляю несколько матриц путаницы и нормализую их.
for i in range(0,215)
[...]
matrix_confusion[i] = np.asarray(confusion_matrix(Y_test, Y_pred))
matrix_confusion[i] = matrix_confusion[i].astype(float) /...
68 просмотров
schedule
22.04.2024
Ожидаемый 2D-массив, вместо него получен 1D-массив, изменение формы данных
Я действительно застрял в этой проблеме. Я пытаюсь использовать OneHotEncoder для кодирования моих данных в матрицу после использования LabelEncoder, но получаю эту ошибку: Ожидаемый массив 2D, вместо этого получен массив 1D.
В конце сообщения об...
15029 просмотров
schedule
25.11.2022
дерево решений, повторяющее имена классов
У меня есть очень простой образец данных/меток, проблема, с которой я сталкиваюсь, заключается в том, что сгенерированное дерево решений (pdf) повторяет имя класса:
from sklearn import tree
from sklearn.externals.six import StringIO
import...
996 просмотров
schedule
20.09.2022
SelectKBest ValueError после логарифмического преобразования целевой переменной
В настоящее время я делаю некоторый анализ набора данных о ценах на жилье в Эймсе, штат Айова. Я успешно обработал данные и удалил все пропущенные значения и т. д., и я собираюсь провести регрессионный анализ. Я хочу построить три модели регрессии:...
185 просмотров
schedule
31.05.2024
Sklearn Агломеративная кластеризация Custom Affinity
Я пытаюсь использовать агломеративную кластеризацию с пользовательской метрикой расстояния (т.е. сродством), так как я хотел бы сгруппировать последовательность целых чисел по сходству последовательностей, а не по евклидову расстоянию, которое не...
3861 просмотров
schedule
04.12.2022
Как отсортировать кортеж numpy без ошибки о том, что только массивы длины 1 могут быть преобразованы в скаляры python
Я использую numpy для генерации собственных векторов и собственных значений. Проблема возникает при формировании их кортежей и попытке отсортировать пары. Я получаю сообщение об ошибке: TypeError: только массивы длины 1 могут быть преобразованы в...
101 просмотров
schedule
05.10.2022
как получить определенный столбец в CSV в python, используя iloc
У меня есть файл CSV с 4 столбцами, и я хочу получить только 2-й и 3-й столбцы в массиве, но я не могу получить, всегда получаю неправильный набор данных. Вот мой код
import pandas as pd
dataset = pd.read_csv('data.csv')
x = dataset.iloc[:1 ,...
55 просмотров
schedule
02.05.2024
Как кодировать данные из другого (тестового) файла по сравнению со всеми данными в одном файле?
Все примеры, с которыми я когда-либо сталкивался, всегда удобно содержат данные в одном файле, чтобы показать, как работает train_test_split (или любая модель). Но довольно часто данные обучения и данные тестирования представляют собой два отдельных...
142 просмотров
schedule
11.12.2023
Ошибка при прогнозировании с помощью python onnxruntime
Я создал очень простое дерево решений, используя библиотеку sklearn . Это дерево обучается на основе 4 функций:
feat1 INT
feat2 INT
feat3 FLOAT
feat4 FLOAT
А метка / целевая функция - это логическое значение (0 или 1).
Я преобразовал...
289 просмотров
schedule
29.03.2024
Нахождение локального минимума между двумя пиками
У меня есть некоторые данные временных рядов в Pandas, где мне нужно извлечь определенные локальные минимумы из столбца, чтобы я мог использовать их в качестве функций в модели LSTM. Чтобы визуализировать то, что я ищу, я приложил Изображение , где...
63 просмотров
schedule
10.10.2022