Вопросы по теме 'weka'

ARFF для обработки естественного языка
Я пытаюсь взять набор обзоров и преобразовать их в формат ARFF для использования с WEKA. К сожалению, либо я совершенно не понимаю, как работает формат, либо мне придется иметь атрибут для ВСЕХ возможных слов, а затем индикатор присутствия....
1809 просмотров
schedule 04.12.2022

Что касается подхода к отображению дерева классификации/решения из командной строки?
В Weka, как отобразить дерево классификации/решения из командной строки?
448 просмотров
schedule 14.04.2024

Как получить результаты от WEKA
Я понимаю, как использовать API WEKA. Сначала я загружаю arff в программу, которая создает Instances . Затем они будут переданы Classifier , обученному этому набору данных. Теперь я хочу дать ему новый тестовый набор данных без метки и заставить...
3630 просмотров
schedule 06.12.2023

Интерфейс Matlab Weka, проблемы с AdaBoost: исключение за пределами границ
Я делаю перекрестную проверку, используя интерфейс Matlab Weka, который я получил от обмена файлами. Моя структура цикла, кажется, отлично работает для логистического классификатора Weka. Однако, когда я пытаюсь сделать то же самое для AdaBoostM1,...
424 просмотров
schedule 11.01.2024

классификация текста унарного класса в weka?
У меня есть обучающий набор данных (текст) для определенной категории (скажем, Рак). Я хочу обучить классификатор SVM для этого класса в weka. Но когда я пытаюсь сделать это, создав папку «рак» и поместив все эти обучающие файлы в эту папку, и когда...
5577 просмотров

Почему алгоритм C4.5 использует сокращение для уменьшения дерева решений и как сокращение влияет на точность предсказания?
Я искал в Google эту проблему и не могу найти что-то, что объясняет этот алгоритм простым, но подробным образом. Например, я знаю, что алгоритм id3 вообще не использует отсечение, поэтому, если у вас есть непрерывная характеристика, процент...
11567 просмотров
schedule 11.11.2022

Как проверить набор данных, действителен ли он для какой-либо классификации в WEKA API?
В Weka 3.6.5 я выполняю следующие шаги: Я использую Проводник Weka и открываю файл набора данных. Я перехожу на панель Classify и нажимаю кнопку «выбрать». Теперь вы можете видеть, что WEKA заблокирует/затенит классификаторы, потому что...
4611 просмотров
schedule 15.03.2024

как объявить атрибут иерархии классов в weka
Я пытаюсь использовать Weka для создания файла .arff и запуска на CLUS. Но у меня проблема с атрибутом иерархии. @attribute 'class hierarchical' {Dummy,Top/Arts/Animation,Top/Arts} Я создаю .arff по этому Кодексу. // 1. set up...
763 просмотров
schedule 20.05.2024

Hadoop: для обучения больших данных (в ГБ) с несколькими деревьями (выборка, скажем, N, например, x RandomTree) и тестирование
Я хочу написать MapReduce (может быть несколько раундов!) 1. Sample N records from Large data - for say X RandomTree 2. Train each tree (totally X) 3. And then test records on all these trees Последовательно, for X = 0 to 199: -...
187 просмотров

могу ли я увидеть проверки на проекте, таком как weka
Я хочу знать процесс обновлений, которые произошли в проекте с открытым исходным кодом, таком как weka https://svn.cms.waikato.ac.nz/svn/weka/ Итак, как я могу увидеть проверки по дате и как я могу внести свой вклад в уже существующий пакет weka?
27 просмотров
schedule 10.03.2024

Weka - Как проверить, есть ли переобучение в weka?
В weka, как мне проверить, соответствует ли индуцированное дерево обучающим данным? ИЗМЕНИТЬ: Итак, вот результаты моего классификатора Random Forest , построенного на большом тренировочном наборе и гораздо меньшем проверочном наборе...
4299 просмотров
schedule 10.11.2023

Поезд и тестовый набор несовместимы с ошибкой в ​​​​weka?
Я пытаюсь проверить свою модель с новым набором данных. Я сделал тот же шаг предварительной обработки, что и для создания моей модели. Я сравнил два файла, но проблем нет. У меня есть все атрибуты (обучение и набор тестовых данных) в том же...
16607 просмотров
schedule 03.12.2023

Фиктивное кодирование номинальных атрибутов — эффект от использования K манекенов, эффект выбора атрибута
Подводя итог моему пониманию темы, 'фиктивное кодирование' обычно понимается как кодирование номинального атрибута с K возможными значениями в виде K-1 бинарных фиктивных значений. Использование значений K вызовет избыточность и окажет негативное...
462 просмотров

Как лучше всего классифицировать многомерный вектор с помощью API weka?
У меня есть многомерные (30000 измерений) векторы целых чисел. У меня 2 класса: [ДА, НЕТ]. У меня 6000 образцов ДА-класса и 50000 образцов НЕТ-класса. Я хотел бы обучить классификатор, чтобы в будущем автоматически классифицировать новые образцы по...
245 просмотров

Получить промежуточные результаты алгоритма большинства голосов в Weka
При использовании классификатора Weka для одного экземпляра он возвращает классификацию, например: double classLabel = classifier.classifyInstance(instance); Я также доверяю (например, используя классификатор RandomForest): double[]...
140 просмотров
schedule 23.05.2024

Извлечение полного имени атрибута из Weka PCA
В настоящее время я пишу код для анализа данных о грибах из UCI . с помощью Weka. Я пытаюсь получить значения (т.е. коэффициенты) атрибутов, но имя атрибута усечено (обозначено знаком "..."), и я не могу получить полный набор коэффициентов из...
784 просмотров
schedule 06.04.2024

отображать персидский текст utf-8, использовать код категоризации текста weka
Я новичок в java. Я хочу преобразовать свой текстовый файл в формат ARFF, но мои тексты на персидском языке, и NetBeans не может отобразить их в хорошем формате (формат utf-8) в этой теме:...
369 просмотров
schedule 16.02.2024

как я могу использовать weka для извлечения терминологии?
мне нужно извлечь термины, относящиеся к предметной области, из большого учебного корпуса, такие как политические термины и т. д. Как я могу использовать Weka и ее фильтры для нацеливания на этот объект? Могу ли я использовать вектор признаков,...
199 просмотров
schedule 30.04.2024

Reptree (WEKA), сортирует значения числовых атрибутов только один раз.
Я использую алгоритм Reptree от weka. Для этого алгоритма нет подробных документов, только: Быстрое обучение дереву решений. Строит дерево решений/регрессии, используя прирост информации/уменьшение дисперсии, и сокращает его, используя сокращение...
4707 просмотров

Как сделать набор для обучения и тестирования из набора данных?
Какой лучший метод: разделить мои данные на наборы для обучения и тестирования, сделав 70% данных обучающими и 30% тестовыми, или использование аналогичных данных для обучения и тестирования набора. A- Правилен ли второй способ и в чем его...
1799 просмотров
schedule 28.02.2024