Извлечение признаков из нейронных сетей

Я делаю простое распознавание букв и цифр с помощью нейронных сетей. До сих пор я использовал каждый пиксель изображения буквы в качестве входа в сеть. Излишне говорить, что при таком подходе получаются очень большие сети. Поэтому я хотел бы извлечь элементы из моих изображений и использовать их в качестве входных данных для сетевых сетей. Мой первый вопрос: какие свойства букв хороши для их распознавания. Второй вопрос: как представить эти функции в качестве входных данных для нейронных сетей. Например, я мог обнаружить все углы букв и иметь их как вектор точек (x, y). Как преобразовать этот вектор во что-то подходящее для НС (поскольку размеры вектора могут быть разными для разных букв).

neural-network ocr feature-detection

kyku 11.07.2012 источник

Ответы (3)

arrow_upward
4
arrow_downward

Многие люди использовали различные функции для распознавания текста. Самым простым из них, конечно же, является прямая передача значений пикселей.

В образцах OpenCV есть данные распознавания букв, извлеченные из набора данных UCI. В нем задействовано около 16 различных функций. Проверьте этот SOF: Как создавать данные из изображения, такие как набор данных распознавания буквенных изображений из UCI

Вы также можете увидеть статью, объясняющую это, в одном из ее ответов. Вы можете получить это в Google.

Также вас может заинтересовать

Abid Rahman K 11.07.2012

arrow_upward
5
arrow_downward

В этой статье Sicco 11.07.2012

arrow_upward
1
arrow_downward

Если у вас есть входной вектор очень большой размерности, я предлагаю вам применить анализ главных компонентов (PCA), чтобы удалить избыточные функции и уменьшить размерность вектора признаков.

Saurav 03.09.2012

Извлечение признаков из нейронных сетей

Ответы (3)

Похожие вопросы