Я пытаюсь создать модель глубокого обучения для обнаружения и чтения номерных знаков с использованием таких методов глубокого обучения, как CNN. Я бы сделал модель в тензорном потоке. Но я до сих пор не знаю, что может быть лучшим подходом для построения такой модели.
я проверил несколько таких моделей https://matthewearl.github.io/2016/05/06/cnn-anpr/
я также проверил некоторые исследовательские работы, но ни один не показывает точный путь.
Итак, шаги, которые я планирую выполнить,
Предварительная обработка изображения с использованием opencv (оттенки серого, преобразования и т. д., я мало что знаю об этой части)
Обнаружение номерного знака (вероятно, методом скользящего окна)
- Тренируйтесь с помощью CNN, создав синтетический набор данных, как показано в приведенной выше ссылке.
Мои вопросы
Есть ли лучший способ сделать это?
Можно ли также комбинировать RNN после CNN для номера переменной длины?
Должен ли я предпочесть обнаружение и распознавание отдельных символов, а не всей пластины?
Есть также много старых методов, которые предпочитают предварительную обработку изображений и прямой переход к OCR. Что будет лучше?
PS- я хочу сделать коммерческую систему реального времени. Так что мне нужна хорошая точность.