Преобразование форматов аннотаций изображений в tfrecords для API обнаружения объектов тензорного потока

Нужна помощь в отношении форматов аннотаций изображений для API обнаружения объектов.

  • Предупреждение:

Как мы знаем, существует два формата аннотаций для изображений: форматы Pascal VOC и COCO. Оба имеют свою собственную спецификацию, вот основное различие между ними:

Паскаль ЛОС:

  1. Сохраняет аннотацию в формате файла .xml.
  2. Формат ограничительной рамки [x-верхний левый, y-верхний левый, x-нижний правый, y-нижний правый]
  3. Создайте отдельный файл аннотаций xml для каждого изображения в наборе данных.

КОКО:

  1. Сохраняет аннотацию в формате файла .json.
  2. Формат ограничительной рамки [x-верхний левый, y-верхний левый, ширина, высота].
  3. Создайте один файл аннотаций для каждого обучения, тестирования и проверки.
  • Текущий выпуск:

У меня есть два набора данных, и вот как они аннотированы.

Набор данных-1:

  • Формат файла: Паскаль VOC(.xml)
  • Формат ограничительной рамки: COCO.
  • Создание файла: как в Pascal VOC (отдельный файл аннотаций xml для каждого изображения в наборе данных).

Набор данных 2:

  • Формат файла: Паскаль VOC(.xml)
  • Формат ограничительной рамки: COCO.
  • Создание файла: как в COCO (создайте один файл аннотации для каждого обучения, тестирования и проверки)

То, что я не могу пройти, - это какой формат (Pascal VOC или COCO) я должен использовать для преобразования моих аннотаций в Tfrecords (.xml в .records), поскольку использование может видеть, что аннотации набора данных не принадлежат исключительно любой из одного формата.

Например, в этой ссылке автор написал сценарий для преобразования .xml в .records, но здесь он имеет дело с чистым форматом Pascal VOC.

А в этой ссылке они имеют дело с чистые форматы аннотаций COCO.

По какому пути мне следует идти, если я нахожусь между обоими форматами?


person maryam mehboob    schedule 01.05.2021    source источник


Ответы (1)