Как выполнить обнаружение объектов с использованием функций CNN в тензорном потоке?

Я пытаюсь создать непрерывную унифицированную модель, которая обнаруживает (локализует) объект на изображении. Сам объект может быть многих типов, например «текст в дикой природе», но окружающие его особенности должны определять, где находится интересующая область.

Как распознавать человеческое лицо, не учитывая его черты. То есть некоторая дистанция ярости на шее.

Я ожидаю, что на выходе будут координаты объекта или что-то вроде формата image-net для создания ограничивающих рамок, например: [xmin, ymin, xmax, ymax] У меня есть набор данных из 500 изображений. Есть ли примеры обнаружения объектов в тензорном потоке по окружающим признакам. то есть карты функций из conv1 или conv2. ?


person iratzhash    schedule 06.05.2016    source источник


Ответы (2)


Существует фреймворк на основе Tensorflow для обнаружения / локализации объектов, который вы можете проверить: https://github.com/Russell91/TensorBox

Хотя я не уверен, что 500 изображений будет достаточно для успешного переобучения представленных моделей.

person Alex    schedule 22.06.2016

Обнаружение объектов с использованием глубокого обучения в целом подразделяется на одноступенчатые детекторы (Yolo, SSD) и двухступенчатые детекторы, такие как Faster RCNN. Репозиторий Google [1] содержит предварительно обученные модели для различных архитектур обнаружения.

Вы можете выбрать предварительно обученную модель, а затем обучить ее на своем наборе данных. Двухступенчатая модель является модульной, и у вас есть выбор различных экстракторов функций в зависимости от того, насколько важны для вас скорость / точность.

[1] Репозиторий обнаружения объектов Google

person rays2pix    schedule 24.03.2018