Юрий Бриганс

В этом году TC Robotics & Ai Conference имели все доказательства, которые нам нужна, что потребительская робототехника, питаемая последней машиной изучения науки, быстро становится бурной промышленностью с большим количеством интересов инвесторов за ним. Новые ML архитектуры и методы выходят почти каждый месяц. Было интересно наблюдать за тем, как эти алгоритмы используются для создания новой волны потребительских технологий, а также за появлением большого количества сервисных предложений, призванных сделать машинное обучение более удобным для пользователей.

Есть два конкретных тенденция, которые очень заметны в этой новой и растущей экосистеме. Эта запись (часть 1) будет изучать один из них.

Универсальные наборы данных

Машинное обучение опирается на много учебных данных. Создать его не так-то просто. Большая часть этого требует ручных человеческих усилий для правильной этикетки. Многие компании возникли, чтобы помочь решить эту проблему, а также сделать сбор данных и маркировку быстрее и проще, в некоторых способах полностью автоматизировать его.

Помимо маркировки, собирать такие учебные данные могут быть так же сложными. Автомобили самостоятельно известный пример - мы все слышали о, и, возможно, даже видели автономные транспортные средства, протестируемые на общественных дорогах. Тем не менее, это может прийти как удивление, что большинство из этих миль вождения не используются для обучения данных сбора данных.

Как объяснил Стерлинг Андерсон Орора и РАКЭВЕЛЬ УРИТАСУН УБЕР, большинство самостоятельных технологий на самом деле обучены в симуляции. Автономные флоты выходят на тестирование обученных моделей в реальном мире. Иногда система отключится и отключает новый сценарий. Состояние разъединения затем разрешено тысячами раз и становится частью моделирования, обеспечивая миллионы виртуальных миль для учебных целей. Это экономически эффективно, масштабируемо и очень эффективно.

Создание таких симуляций не тривиально. Чтобы обеспечить правильную верность, не только виртуальный мир должен выглядеть визуально гиперреалистическими, но все данные датчика (лидар, радар и сотнях других) также должны быть идеально синхронизированы для виртуальной среды. Думаю, симулятор полета, но с гораздо лучшей графикой. Во многих случаях могут быть смоделированы сбои датчиков, а также системы самостоятельной вождения должны иметь возможность справиться с внезапной потерей входных данных.

Визуальные данные общеизвестно трудно метить. Сиделирование в сторону, представьте, что если вы поручете сдать всеми автомобилями, людьми, кошками, собаками, лампы, фонари, деревья, дорожные маркировки и знаки в одном изображении. И есть десятки тысяч изображений, чтобы пройти. Это где такие компании, как Superannotate и Scaleai.

Superannotate предоставляет инструмент, который сочетает в себе сегментацию на основе Superpixel с людьми в цикле, чтобы обеспечить быстрое создание масок сегментации сегментации. Представьте себе беспилотник Orthomosaic, взятый на лес с различными видами деревьев - инструменты, как это позволяет человеку быстро создавать очертания вокруг деревьев, принадлежащих к определенной категории, просто нажав на них.

Подход Superannotate интересен, но, вероятно, не будет достаточным для всех сценариев. Это полезно в ситуациях, когда у вас есть четко определенные контрастные края вокруг объектов, которые вы пытаетесь сегментировать, но, вероятно, это не сработает для менее четких разделительных линий. Хорошим примером, когда вы можете понять, где заканчиваются верхние губы, и верхняя резинка начинается в портретах улыбающихся людей. Это, вероятно, потребует пользовательского инструмента маркировки - то, что мы в валентности создали на ряде случаев.

Scaleai принимает другой подход и опирается на комбинацию статистических инструментов, проверки машин и главное, людей. Это очень интересная концепция - эффективно механический турок для маркировки данных.

Таким образом, быстро становится очевидным, что сбор и обучение и обучение данных являются целые отдельные столбы промышленности ML-питание. Можно себе представить будущее, где новый «ручной труд» маркирует или собирает данные. Это увлекательное поле для просмотра, так как он дает нам представление о видах новых рабочих мест, доступных для людей, которые сейчас находятся под угрозой безработицы через автоматизацию. С одной оговоркой — эти системы распределены, поэтому, даже если вы получаете работу в качестве специалиста по маркировке данных, вы можете конкурировать с людьми со всего мира, что сразу же сказывается на доходах.

С другой стороны, настраивая моделирование и выяснение способов собирать «сложные» данные, могут быть целой инженерной вертикальной самостоятельной. В качестве текущей видеоигры AR / VR или General 3D художник / разработчик, вы можете найти свои навыки, очень применимые в мире AI / ML. Мой друг недавно нашел приложение, которое позволяет вам рассчитать свою оценку Mahjong, сделав фотографию вашей плитки. Как бы вы тренировали модель, чтобы распознать эти плитки с фотографии, в различных условиях освещения и от всех углов? Вы можете кропотливо делать фотографии плиток и попытаться обозначать их самостоятельно, или вы можете нанять трехмерную артистку в 3D-модели. После того, как у вас есть реалистичные 3D-модели, вы можете раскрутить ряд экземпляров EC2, работающего Blender (эффективно «рендеринг фермы» в облаке). Используя Python, вы можете затем программно программно сценарию различные сцены (углы, фонари и т. Д.) И используют механизм лучающегося луча, чтобы пролить тысячи предварительно с надписью 3D-рендуры моделируемой плитки во всех видах позиций, углов, цветов и т. Д.

Но что, если ваша задача - обнаружить погодные условия (ветер, дождь, град, гром, снег) через небольшое устройство с помощью дешевого микрофона в качестве датчика. Где вы получаете все тренировочные звуки для создания вашей модели? Scraping YouTube для звука может только получить вас до сих пор - в конце концов, эти звуки записываются с различными микрофонами, фоновыми шумами и различными условиями. В этом случае вы можете выбрать создание физических устройств, разработанных специально для этого типа сбора данных. Они могут быть дорогими, но могут содержать необходимый набор датчиков для точно записи и маркировки звука, который вы ищете, используя микрофоны, которые вы будете использовать в производстве. Как только данные будут собраны, вы можете тренировать модель и запустить вывод на дешевое пограничное устройство. Придумываясь с такими методами сбора данных, могут стать собственным техническим сбором, а выполнение требует ручного труда для развертывания этих методов в полевых условиях. Это интересная инженерная проблема, которую, несомненно, рождает ряд специализированных услуг и консультационных стартапов.

Здесь, в валентности у нас есть необходимый талант, чтобы собрать необходимые данные, либо через краудсорсинг, имитацию (мы делаем AR / VR в доме и имеем талантливые 3D-артисты), используя существующие инструменты маркировки, создавая пользовательские инструменты маркировки или построения физических инструментов устройства, которые можно использовать для сбора полевых данных. Мы можем настроить необходимую инфраструктуру для постоянного повторного приема вашей модели в облаке и автоматически развертывает ее до производства, обеспечивая цикл закрытого цикла непрерывного улучшения.

Юрий Бриганс

Юрий Бриганс управляет программным обеспечением Валентская программная группа. Как кто-то, кто вырос мечтать о том, чтобы быть изобретателем и построить прохладные вещи, Юрий провел за десять лет через несколько инженерных дисциплин, работающих над облачной инфраструктурой, мобильными приложениями, аппаратными продуктами и совсем недавно изучением машин. В свободное время Юрий управляет небольшим производством Biz, которая строит игрушки для лазерных кошек AI, чрезмерно потребляющие домашнее эспрессо и плавают вокруг озера Вашингтон в его электрическом каяке.