Извлечение признаков из нейронных сетей

Я делаю простое распознавание букв и цифр с помощью нейронных сетей. До сих пор я использовал каждый пиксель изображения буквы в качестве входа в сеть. Излишне говорить, что при таком подходе получаются очень большие сети. Поэтому я хотел бы извлечь элементы из моих изображений и использовать их в качестве входных данных для сетевых сетей. Мой первый вопрос: какие свойства букв хороши для их распознавания. Второй вопрос: как представить эти функции в качестве входных данных для нейронных сетей. Например, я мог обнаружить все углы букв и иметь их как вектор точек (x, y). Как преобразовать этот вектор во что-то подходящее для НС (поскольку размеры вектора могут быть разными для разных букв).


person kyku    schedule 11.07.2012    source источник


Ответы (3)


Многие люди использовали различные функции для распознавания текста. Самым простым из них, конечно же, является прямая передача значений пикселей.

В образцах OpenCV есть данные распознавания букв, извлеченные из набора данных UCI. В нем задействовано около 16 различных функций. Проверьте этот SOF: Как создавать данные из изображения, такие как набор данных распознавания буквенных изображений из UCI

Вы также можете увидеть статью, объясняющую это, в одном из ее ответов. Вы можете получить это в Google.

Также вас может заинтересовать



Если у вас есть входной вектор очень большой размерности, я предлагаю вам применить анализ главных компонентов (PCA), чтобы удалить избыточные функции и уменьшить размерность вектора признаков.

person Saurav    schedule 03.09.2012