Вопросы по теме 'cross-validation'

Как sklearn LassoCV выполняет перекрестную проверку?
Я хотел бы знать, как sklearn.LassoCV выполняет перекрестную проверку. В частности, хотелось бы узнать, как образцы разбиты по складкам. Это случайный или детерминированный процесс? Например, предположим, что у меня есть 100 образцов, и я...
1580 просмотров
schedule 21.10.2022

перекрестная проверка scikit-learn, отрицательные значения со среднеквадратичной ошибкой
Когда я использую следующий код с матрицей данных X размера (952,144) и вектором вывода y размера (952), метрика mean_squared_error возвращает отрицательные значения, что является неожиданным. Есть ли у вас какие-либо идеи? from sklearn.svm...
61076 просмотров

Создание таблицы с отдельными испытаниями из таблицы частот в R (обратная функция таблицы)
У меня есть таблица частот данных в data.frame в R, где перечислены уровни факторов и количество успехов и неудач. Я хотел бы превратить его из таблицы частот в список событий, т.е. напротив команды "таблица". В частности, я хотел бы повернуть...
497 просмотров
schedule 05.11.2023

Выполните перекрестную проверку на randomForest с помощью R
Я использую пакет randomForest для R для обучения модели классификации. Чтобы сравнить его с другими классификаторами, мне нужен способ отобразить всю информацию, предоставленную довольно подробным методом перекрестной проверки в Weka ....
2836 просмотров

Поиск по сетке гиперпараметров SVM-анова и получение выбранной функции в Sklearn
В документе sklearn есть пример SVM-Anova . Я хочу дополнительно сделать GridSearchCV для гиперпараметров, идентификатора, C и гаммы для SVM для каждого процентиля функций, используемых в примере, например: transform =...
532 просмотров

Разделите mysql на несколько наборов для перекрестной проверки
Привет, я создал способ рекомендовать фильмы из набора данных Movielens. Проблема со мной в том, как разделить таблицу в базе данных на основе просмотренных пользователем фильмов на складки для применения перекрестной проверки. Этот пример подробно...
127 просмотров

Как использовать масштабирование платформы с перекрестной проверкой с помощью LIBSVM?
Может ли кто-нибудь привести мне пример, чтобы показать, как масштабирование платформы используется вместе с перекрестной проверкой в ​​k-кратном размере в мультиклассовой классификации SVM в libsvm? Я разделил весь набор данных на две части:...
431 просмотров

оценка f1 всех классов от scikits cross_val_score
Я использую cross_val_score из scikit-learn (пакет sklearn.cross_validation ) для оценки моих классификаторов. Если я использую f1 для параметра scoring , функция вернет оценку f1 для одного класса. Чтобы получить среднее значение, я могу...
9858 просмотров
schedule 05.12.2022

Анализ настроений - перекрестная проверка недействительна
Я тестирую модель анализа настроений с использованием NLTK и SKlearn. Данные Movie_reviews имеют метки «pos» и «neg». Для обучения классификатора я использую «наборы функций». Я использую перекрестную проверку данных обучения и точность данных...
625 просмотров

Ошибка отсутствия значения при использовании предварительной обработки bagImpute в функции Caret::train
Я хочу обучить модель случайного леса с помощью процедуры repeatedcv , используя caret::train . В моих данных есть некоторые пропущенные значения, поэтому я хочу использовать параметр preProcess="bagImpute" в функции поезда. Я не хочу...
1482 просмотров

Scikit-learn, GroupKFold с перетасовкой групп?
Я использовал StratifiedKFold из scikit-learn, но теперь мне нужно следить и за «группами». Есть хорошая функция GroupKFold, но мои данные очень зависят от времени. Так же, как и в справке, т.е. номер недели является индексом группировки. Но каждую...
5874 просмотров

Отличительные показатели последней стратифицированной K-кратной производительности
Я делю свой тренировочный набор на стратифицированные k-складки следующим образом: n_folds = 5 skf = list(StratifiedKFold(y, n_folds, random_state=SEED)) for k, (train, test) in enumerate(skf): X_train = X[train] y_train = y[train]...
151 просмотров

Как обосновать использование модели прогнозирования с более высоким RMSE (cv=10)
Я работаю над моделью прогнозирования. Чтобы получить наилучшую возможную модель, я использую cross_val_score для сравнения различных моделей с CV = 10 и RMSE, я получаю следующее: Lasso SVR...
70 просмотров

Несоответствие результатов десятикратной перекрестной проверки в WEKA
Вчера я использовал 2 способа реализации 10-кратной перекрестной проверки в weka, но результаты противоречивы. Способ 1: напрямую вызвать метод eval.crossValidateModel() , J48 j48 = new J48(); j48.buildClassifier(ins); // ins is the...
532 просмотров
schedule 15.02.2024

Sklearn: получить последний сплит из timeSeriesSplit
Поэтому я использую timeSeriesSplit из sklearn для разделения мои данные такие, tscv = TimeSeriesSplit(n_splits=3) Теперь я знаю, что для получения индексов разделения нам нужно перебрать tscv.split(X) . У меня вопрос: можно ли перейти...
809 просмотров

Воспроизводимое разбиение данных на обучение и тестирование в R
Распространенным способом выборки/разделения данных в R является использование sample , например, для номеров строк. Например: require(data.table) set.seed(1) population <- as.character(1e5:(1e6-1)) # some made up ID names N <- 1e4 #...
483 просмотров

Как использовать перекрестную проверку после вменения в набор для обучения и проверки?
Так что я немного запутался. На данный момент у меня есть набор данных примерно из 800 экземпляров. Я разделил его на набор для обучения и проверки, потому что отсутствовали значения, поэтому я использовал SimpleImputer из sklearn и...
524 просмотров
schedule 09.01.2024

Использует ли перекрестная проверка K-Fold все K-1 складки на каждом этапе обучения в классификации?
Использует ли перекрестная проверка K-Fold все K-1 складки на каждом этапе обучения? Если у меня есть складка A, B, C и D и я использую D в качестве тестовой складки на шаге k – k + 1, будет Я использую A + B + C в качестве данных для...
62 просмотров
schedule 04.03.2024

Кривая ROC для Kfold в Scikit-learn. Хорошо работает для StratifiedKfold, но показывает ошибку для Kfold
Я хочу построить кривую ROC с помощью перекрестной проверки Kfold . Однако код, приведенный на странице scikit-learn , предназначен для StratifiedKfold . Таким образом, когда я меняю StratifiedKfold на Kfold , он дает мне None результатов...
148 просмотров
schedule 09.03.2024

Как можно разделить данные временных рядов с помощью нескольких функций, чтобы получить непрерывный график, содержащий [поезд + тест + прогноз]?
У меня есть отформатированный набор данных , который выглядит как матрица[NxM ] где N = 40 общее количество циклов (временных меток) и M = 1440 пикселей. Для каждого цикла у меня есть значения 1440 пикселей, соответствующие 1440 пикселям. Я...
43 просмотров