Нужна помощь в отношении форматов аннотаций изображений для API обнаружения объектов.
- Предупреждение:
Как мы знаем, существует два формата аннотаций для изображений: форматы Pascal VOC и COCO. Оба имеют свою собственную спецификацию, вот основное различие между ними:
Паскаль ЛОС:
- Сохраняет аннотацию в формате файла .xml.
- Формат ограничительной рамки [x-верхний левый, y-верхний левый, x-нижний правый, y-нижний правый]
- Создайте отдельный файл аннотаций xml для каждого изображения в наборе данных.
КОКО:
- Сохраняет аннотацию в формате файла .json.
- Формат ограничительной рамки [x-верхний левый, y-верхний левый, ширина, высота].
- Создайте один файл аннотаций для каждого обучения, тестирования и проверки.
- Текущий выпуск:
У меня есть два набора данных, и вот как они аннотированы.
Набор данных-1:
- Формат файла: Паскаль VOC(.xml)
- Формат ограничительной рамки: COCO.
- Создание файла: как в Pascal VOC (отдельный файл аннотаций xml для каждого изображения в наборе данных).
Набор данных 2:
- Формат файла: Паскаль VOC(.xml)
- Формат ограничительной рамки: COCO.
- Создание файла: как в COCO (создайте один файл аннотации для каждого обучения, тестирования и проверки)
То, что я не могу пройти, - это какой формат (Pascal VOC или COCO) я должен использовать для преобразования моих аннотаций в Tfrecords (.xml в .records), поскольку использование может видеть, что аннотации набора данных не принадлежат исключительно любой из одного формата.
Например, в этой ссылке автор написал сценарий для преобразования .xml в .records, но здесь он имеет дело с чистым форматом Pascal VOC.
А в этой ссылке они имеют дело с чистые форматы аннотаций COCO.
По какому пути мне следует идти, если я нахожусь между обоими форматами?