Почему дерево решений показывает правильную классификацию, в то время как некоторые экземпляры классифицируются неправильно

Я использую WEKA, 10-кратную перекрестную проверку или разделение 66% для создания обучающих и тестовых наборов. Я использовал c4.5 (J48) в качестве классификатора. визуализировать дерево, я вижу, что на основе дерева экземпляры должны были быть классифицированы правильно !!!

Я не вижу этого, когда тестовый набор является одним и тем же обучающим набором.. если классификатор решил создать такое дерево, почему некоторые экземпляры не классифицируются на основе этого дерева???

Заранее спасибо.


person Abdullah Awaysheh    schedule 21.10.2014    source источник
comment
Почему дерево решений показывает правильную классификацию, в то время как некоторые экземпляры классифицируются неправильно   -  person Abdullah Awaysheh    schedule 21.10.2014


Ответы (1)


Похоже, вы ищете полностью необрезанное дерево, поэтому данные обучения должны возвращать точность 100%.

Варианты, которые могут привести к нежелательным результатам, описаны ниже:

  • Unpruned используется для минимизации количества правил в дереве решений и может привести к снижению ошибки обобщения.
  • minNumObj используется для определения минимального количества наблюдений, необходимого для создания правила. Если это значение выше единицы, вы можете получить некоторые ошибки в обучающих данных.

Обычно я бы не рекомендовал использовать эти параметры для конкретной задачи, но если вы пытаетесь получить 100%-й результат на обучающих данных, это будет то место, с которого стоит начать.

Надеюсь это поможет!

person Matthew Spencer    schedule 21.10.2014