Вопросы по теме 'sklearn-pandas'

scikit научиться дискретизировать категориальные числовые данные
Я пытаюсь дискретизировать данные для классификации. Их значения были строками, и я преобразовал их в числа 0,1,2,3. Вот как выглядят данные (кадр данных pandas). Я разделил фрейм данных на dataLabel и dataFeatures Label Feat1 Feat2...
257 просмотров

ValueError: этому решателю нужны образцы как минимум 2 классов в данных, но данные содержат только один класс: 0.0
Я применил логистическую регрессию к набору поездов после разделения набора данных на наборы тестов и поездов, но получил указанную выше ошибку. Я попытался разобраться, и когда я попытался напечатать свой вектор ответа y_train в консоли, он печатает...
21461 просмотров

Доступ к строкам по целым числам и столбцам по меткам Pandas
Мои данные такие: [Первая строка — заголовки] Name,Email,Age Sachith,[email protected],23 Sim,[email protected],234 Yoshi,[email protected],2345 sarla,[email protected],234 Я хотел бы получить доступ к элементам, чтобы строки были указаны как целые...
7558 просмотров
schedule 14.10.2022

Вычисление матриц путаницы
В настоящее время я вычисляю несколько матриц путаницы и нормализую их. for i in range(0,215) [...] matrix_confusion[i] = np.asarray(confusion_matrix(Y_test, Y_pred)) matrix_confusion[i] = matrix_confusion[i].astype(float) /...
68 просмотров

Ожидаемый 2D-массив, вместо него получен 1D-массив, изменение формы данных
Я действительно застрял в этой проблеме. Я пытаюсь использовать OneHotEncoder для кодирования моих данных в матрицу после использования LabelEncoder, но получаю эту ошибку: Ожидаемый массив 2D, вместо этого получен массив 1D. В конце сообщения об...
15029 просмотров

дерево решений, повторяющее имена классов
У меня есть очень простой образец данных/меток, проблема, с которой я сталкиваюсь, заключается в том, что сгенерированное дерево решений (pdf) повторяет имя класса: from sklearn import tree from sklearn.externals.six import StringIO import...
996 просмотров

SelectKBest ValueError после логарифмического преобразования целевой переменной
В настоящее время я делаю некоторый анализ набора данных о ценах на жилье в Эймсе, штат Айова. Я успешно обработал данные и удалил все пропущенные значения и т. д., и я собираюсь провести регрессионный анализ. Я хочу построить три модели регрессии:...
185 просмотров

Sklearn Агломеративная кластеризация Custom Affinity
Я пытаюсь использовать агломеративную кластеризацию с пользовательской метрикой расстояния (т.е. сродством), так как я хотел бы сгруппировать последовательность целых чисел по сходству последовательностей, а не по евклидову расстоянию, которое не...
3861 просмотров

Как отсортировать кортеж numpy без ошибки о том, что только массивы длины 1 могут быть преобразованы в скаляры python
Я использую numpy для генерации собственных векторов и собственных значений. Проблема возникает при формировании их кортежей и попытке отсортировать пары. Я получаю сообщение об ошибке: TypeError: только массивы длины 1 могут быть преобразованы в...
101 просмотров
schedule 05.10.2022

как получить определенный столбец в CSV в python, используя iloc
У меня есть файл CSV с 4 столбцами, и я хочу получить только 2-й и 3-й столбцы в массиве, но я не могу получить, всегда получаю неправильный набор данных. Вот мой код import pandas as pd dataset = pd.read_csv('data.csv') x = dataset.iloc[:1 ,...
55 просмотров
schedule 02.05.2024

Как кодировать данные из другого (тестового) файла по сравнению со всеми данными в одном файле?
Все примеры, с которыми я когда-либо сталкивался, всегда удобно содержат данные в одном файле, чтобы показать, как работает train_test_split (или любая модель). Но довольно часто данные обучения и данные тестирования представляют собой два отдельных...
142 просмотров
schedule 11.12.2023

Ошибка при прогнозировании с помощью python onnxruntime
Я создал очень простое дерево решений, используя библиотеку sklearn . Это дерево обучается на основе 4 функций: feat1 INT feat2 INT feat3 FLOAT feat4 FLOAT А метка / целевая функция - это логическое значение (0 или 1). Я преобразовал...
289 просмотров

Нахождение локального минимума между двумя пиками
У меня есть некоторые данные временных рядов в Pandas, где мне нужно извлечь определенные локальные минимумы из столбца, чтобы я мог использовать их в качестве функций в модели LSTM. Чтобы визуализировать то, что я ищу, я приложил Изображение , где...
63 просмотров