Публикации по тематике computer-vision

Публикации по теме 'computer-vision'

Метод Оцу

Недавно я изучаю некоторые классические методы компьютерного зрения по заметкам , и я считаю хорошей привычкой делать заметки, так что я здесь. Я впервые пишу статью на Medium. Так что могут быть некоторые ошибки, и я буду очень рад, что вы укажете на них. В этой статье я покажу вам математические детали метода Оцу и покажу вам пример, вы можете просмотреть Код Python здесь , хотя это действительно простой пример. Введение Метод Оцу можно использовать для преобразования..

День 2: Набор приемов для классификации изображений с помощью сверточных нейронных сетей

[ 4 декабря 2018 г. ] Современные хитрости для повышения популярности вашего CNN TL-DR Сверточные сети с глубоким обучением претерпели множество улучшений, не связанных напрямую с архитектурой. В этой статье исследуется набор приемов, которые явно улучшают производительность практически без затрат на сложность. Многие из этих хитростей добавлены в фастай 😍. Большой размер партии В статье представлены четыре метода, которые позволяют эффективно обучать сети с большими..

Проектирование систем слежения за объектами

Отслеживание объектов связано с определенным набором проблем и компромиссов, которые делают его одной из самых сложных специальностей в области компьютерного зрения. Видеоданные обычно тяжелее статических изображений, используемых в моделях классификации. Скорость часто имеет первостепенное значение, поскольку многие модели развертываются для отслеживания объектов в режиме реального времени, что требует жесткой оптимизации задержки. И в отличие от других моделей компьютерного зрения,..

Танцуй под музыку! Stick Figures Groove с новой моделью «seq2seq» и учебным планом

Танцы могут быть естественными для многих людей, но это гораздо больше, чем мы можем себе представить. Ключевой проблемой в обучении моделей ИИ танцевать, как человек, является высокая пространственно-временная сложность моделирования динамики движения человека. В последние годы многие исследователи работали над синтезом танцевальных движений из музыки, но эти попытки, как правило, включают кратковременную генерацию танца продолжительностью менее 30 секунд. Теперь исследователи из..

Знаки говорят громче, чем слова

Разработка модели распознавания изображений для американского языка жестов (ASL) Способность эффективно общаться является важным аспектом человеческого существования, однако она остается проблемой для людей с нарушениями слуха или речи. К счастью, американский язык жестов (ASL) служит мостом, который соединяет этих людей с более широким обществом, позволяя им выражать себя и устанавливать значимые связи. Цель проекта — научить модель распознавать язык жестов в режиме реального времени,..

Обнаружение логотипа в прямых трансляциях с использованием YOLOv4 — Онур Озбек

Это проект, над которым я работал во время стажировки. Цель состоит в том, чтобы в основном обнаруживать логотипы, которые появляются в игровых трансляциях от создателей контента, киберспортивных событий и т. Д. Крупные бренды вкладывают значительные средства в эти потоки и тратят много денег на спонсорство, поэтому имеет смысл только то, что они хотели бы знать если другая сторона придерживалась своей части сделки. Мы приступим к делу. Давайте поговорим о данных (которые были..

Функция активации — Основы глубокого обучения — Идиот-разработчик

Глубокое обучение — это подмножество машинного обучения, в котором используются нейронные сети с несколькими слоями для анализа и выявления закономерностей в данных. Одним из ключевых компонентов глубокого обучения является функция активации, которая отвечает за определение выходных данных каждого нейрона в сети. В этом сообщении блога мы рассмотрим основы функций активации и их роль в глубоком обучении. Что такое функция активации? Функция активации — это математическая функция,..