В настоящее время я начинаю разрабатывать приложение компьютерного зрения, которое включает в себя отслеживание людей. Я хочу создать достоверные метаданные для видео, которые будут записаны в этом проекте. Метаданные, вероятно, нужно будет пометить вручную, и в основном они будут состоять из местоположения людей на изображении. Я хочу использовать метаданные для оценки производительности моих алгоритмов.
Конечно, я мог бы создать инструмент для маркировки, используя, например. qt и/или opencv, но мне было интересно, есть ли для этого какой-то стандарт де-факто. Я наткнулся на Viper, но он кажется мертвым и работает не так просто, как я надеялся. . Кроме этого, я не нашел много.
Есть ли у кого-нибудь здесь рекомендации относительно того, какое программное обеспечение / стандарт / метод использовать как для маркировки, так и для оценки? Я предпочитаю что-то, ориентированное на С++, но это не является жестким ограничением.
С уважением и заранее спасибо! Том