Как выполнить обнаружение объектов с использованием функций CNN в тензорном потоке?

Я пытаюсь создать непрерывную унифицированную модель, которая обнаруживает (локализует) объект на изображении. Сам объект может быть многих типов, например «текст в дикой природе», но окружающие его особенности должны определять, где находится интересующая область.

Как распознавать человеческое лицо, не учитывая его черты. То есть некоторая дистанция ярости на шее.

Я ожидаю, что на выходе будут координаты объекта или что-то вроде формата image-net для создания ограничивающих рамок, например: [xmin, ymin, xmax, ymax] У меня есть набор данных из 500 изображений. Есть ли примеры обнаружения объектов в тензорном потоке по окружающим признакам. то есть карты функций из conv1 или conv2. ?

iratzhash 06.05.2016 источник

Ответы (2)

arrow_upward
4
arrow_downward

Существует фреймворк на основе Tensorflow для обнаружения / локализации объектов, который вы можете проверить: https://github.com/Russell91/TensorBox

Хотя я не уверен, что 500 изображений будет достаточно для успешного переобучения представленных моделей.

Alex 22.06.2016

arrow_upward
2
arrow_downward

Обнаружение объектов с использованием глубокого обучения в целом подразделяется на одноступенчатые детекторы (Yolo, SSD) и двухступенчатые детекторы, такие как Faster RCNN. Репозиторий Google [1] содержит предварительно обученные модели для различных архитектур обнаружения.

Вы можете выбрать предварительно обученную модель, а затем обучить ее на своем наборе данных. Двухступенчатая модель является модульной, и у вас есть выбор различных экстракторов функций в зависимости от того, насколько важны для вас скорость / точность.

[1] Репозиторий обнаружения объектов Google

rays2pix 24.03.2018

Как выполнить обнаружение объектов с использованием функций CNN в тензорном потоке?

Ответы (2)

Похожие вопросы