Преобразование форматов аннотаций изображений в tfrecords для API обнаружения объектов тензорного потока

Нужна помощь в отношении форматов аннотаций изображений для API обнаружения объектов.

Предупреждение:

Как мы знаем, существует два формата аннотаций для изображений: форматы Pascal VOC и COCO. Оба имеют свою собственную спецификацию, вот основное различие между ними:

Паскаль ЛОС:

Сохраняет аннотацию в формате файла .xml.
Формат ограничительной рамки [x-верхний левый, y-верхний левый, x-нижний правый, y-нижний правый]
Создайте отдельный файл аннотаций xml для каждого изображения в наборе данных.

КОКО:

Сохраняет аннотацию в формате файла .json.
Формат ограничительной рамки [x-верхний левый, y-верхний левый, ширина, высота].
Создайте один файл аннотаций для каждого обучения, тестирования и проверки.

Текущий выпуск:

У меня есть два набора данных, и вот как они аннотированы.

Набор данных-1:

Формат файла: Паскаль VOC(.xml)
Формат ограничительной рамки: COCO.
Создание файла: как в Pascal VOC (отдельный файл аннотаций xml для каждого изображения в наборе данных).

Набор данных 2:

Формат файла: Паскаль VOC(.xml)
Формат ограничительной рамки: COCO.
Создание файла: как в COCO (создайте один файл аннотации для каждого обучения, тестирования и проверки)

То, что я не могу пройти, - это какой формат (Pascal VOC или COCO) я должен использовать для преобразования моих аннотаций в Tfrecords (.xml в .records), поскольку использование может видеть, что аннотации набора данных не принадлежат исключительно любой из одного формата.

Например, в этой ссылке автор написал сценарий для преобразования .xml в .records, но здесь он имеет дело с чистым форматом Pascal VOC.

А в этой ссылке они имеют дело с чистые форматы аннотаций COCO.

По какому пути мне следует идти, если я нахожусь между обоими форматами?

maryam mehboob 01.05.2021 источник

Ответы (1)

arrow_upward
0
arrow_downward

По какому пути мне следует идти, поскольку я стою посреди обоих форматов?

Используйте формат Pascal VOC для преобразования .xml в .records.

Внесите следующие изменения в функцию create_tf_example этой ссылки< /а>

for index, row in group.TextLine.iterrows():
xmin.append(row['X']/imgwidth)
xmax.append((row['X']+row['Width'])/imgwidth)
ymin.append(row['Y']/imgheight)
ymax.append((row['Y']+row['Height'])/imgheight)
classes_text.append(row['class'].encode('utf8'))
classes.append(class_text_to_int(row['class']))'

В случае, если у вас есть X, Y, ширина, высота в ваших аннотациях .xml вместо xmin, ymin, xmax, ymax.

maryam mehboob 08.05.2021

Преобразование форматов аннотаций изображений в tfrecords для API обнаружения объектов тензорного потока

Ответы (1)

Похожие вопросы