«Меня соблазняет большой набор бизнес-сценариев Alibaba и огромная пользовательская база, — говорит Сяофэн Рен.

Известный специалист по компьютерному зрению недавно прилетел обратно в Китай из Сиэтла, сделав свою первую остановку на конференции в Пекине с тех пор, как присоединился к Alibaba в качестве заместителя декана и главного научного сотрудника Института наук о данных и технологий (iDST).

После получения докторской степени в Калифорнийском университете в Лос-Анджелесе под руководством доктора Джитендры Малика Рен был назначен аффилированным профессором факультета компьютерных наук Вашингтонского университета. В роли старшего главного научного сотрудника Amazon Рен руководил командой по компьютерному зрению, а также был председателем на CVPR и ICCV (ведущие конференции по компьютерному зрению), где его статьи цитировались более 9000 раз.

IDST — это основной научно-исследовательский институт Alibaba, занимающийся машинным обучением, интеллектуальным анализом больших данных, обработкой естественного языка, мобильным поиском и мультимедийной идентификацией; с офисами в Ханчжоу, Пекине, Сиэтле и Силиконовой долине. Он также отвечает за мозг искусственного интеллекта для плана НАСА Alibaba.

Ронг Джин, декан iDST, уважает предыдущего работодателя Рена за его стиль работы. Он сказал Li Xiang Business Review: «Amazon и Google разные, Amazon производит влиятельные продукты, не нанимая слишком много технологов, что свидетельствует о способности компании формировать идеи. Создание продукта связано с пользовательским опытом, поэтому не так просто, как разработка технологии. Чтобы технология оказала огромное влияние, она должна работать в рыночной среде с полноценным пользовательским интерфейсом».

Amazon представила такие продукты, как Alexa и Amazon Go, чтобы расширить сферу своей деятельности за пределы электронной коммерции. Компания делает упор на эффективность, и в настоящее время только 40 человек работают над компьютерным зрением по сравнению с 200 в Google.

Рен говорит нам, что хочет «реализовать что-то [в iDST], что раньше не удавалось». С этой целью он вернулся в Китай, чтобы ознакомиться с работой команды Alibaba, и возьмет ее оттуда.

Synced недавно говорил с Реном о большом переезде.

О присоединении к Алибабе

Синхронизировано: вы создаете команду в Сиэтле для Alibaba, какова ее функциональность?

Сяофэн Рен: В Соединенных Штатах много талантов, что служит цели глобализации кадрового резерва Alibaba. Команда надеется привлечь первоклассные американские таланты. У нас пока нет команды, и многие идеи остаются на поверхности. Мне еще предстоит обсудить детали с Ронг Джином в отношении координации, разделения труда и т. д.

Синхронизировано: есть ли различия в видении или целях команды из Сиэтла?

Сяофэн Рен: Не совсем так. Команда из Сиэтла должна иметь возможность синхронизироваться с командой Китая.

Синхронизация. Какие изменения произошли в исследованиях и разработках в области компьютерного зрения за последние несколько лет?

Сяофэн Рен: Технология вступает в фазу коммерческой разработки. Когда я начинал, это было все еще очень теоретически. В основном мы просто запускали алгоритмы на нескольких изображениях, не зная, когда их можно будет использовать. Я был свидетелем большого прогресса с момента выпуска до сегодняшнего дня.

Синхронизировано: что на вас повлияло?

Xiaofeng Ren: Microsoft Kinect (линейка устройств ввода с датчиком движения для Xbox и ПК с Windows, представленная в 2010 году). Я думаю, что с этого момента я смог увидеть больше практических сценариев применения. По этой причине я провел исследование камер глубины.

Синхронизировано. На каких сценариях технических исследований или приложений вы планируете сосредоточиться?

Сяофэн Рен: С технической точки зрения, меня интересует, как сделать вещи более эффективными, точно обрабатывая изображения и видеоданные. Инновации этих технологий могут помочь каждому улучшить опыт. Но системы реального времени в реальных условиях требуют высоких технических знаний и в настоящее время являются передовым направлением исследований.

В беспилотных розничных магазинах

Синхронизация. Беспилотные розничные магазины привлекли большое внимание. Какую роль сыграла технология компьютерного зрения? Какие проблемы?

Сяофэн Рен: Компьютерное зрение, безусловно, многое объясняет, но я не могу раскрывать подробности. Одной из больших проблем является точность, алгоритм должен решать множество задач на основе множества данных, а получение такого широкого диапазона источников данных само по себе является проблемой.

Синхронизировано. Если бы компьютерное зрение использовалось для всего процесса покупки, были бы затраты слишком высокими?

Сяофэн Рен: В долгосрочной перспективе затраты на аппаратное обеспечение камеры и вычислительные ресурсы падают очень быстро. А вот по конкретным расходам сказать сложно.

Синхронизировано. Каковы особенности применения технологии компьютерного зрения в розничной торговле? Есть ли узкие места?

Сяофэн Рен: Я думаю, что есть большие различия как в фундаментальных, так и в прикладных исследованиях. Для розничной торговли очень важно воспринимать товары и действия покупателей; что может быть не так, например, для автономного вождения. Что касается узких мест, то все постоянно думают о новых областях применения. Конечно, есть много технических проблем, потому что, когда люди делают непредсказуемые жесты, нам нужно соответствующим образом настроить продукт.

Синхронизировано: Какие приложения компьютерного зрения лучше всего подходят для коммерческого использования?

Сяофэн Рен: Я очень надеюсь, что компьютерное зрение может найти широкое применение, например, в розничной торговле, офисе или дома. Есть много компаний, использующих компьютерное зрение для офисов. При наличии интеллектуальных приложений даже такая простая вещь, как телефонные конференции, может генерировать множество бизнес-потоков.

Об исследованиях и разработках

Синхронизировано. Каково ваше личное понимание компьютерного зрения? Насколько мы понимаем, вы использовали психологию в качестве основы для изучения компьютерного зрения.

Сяофэн Рен: С одной стороны, на меня большое влияние оказал мой научный руководитель профессор Джитендра Малик, у которого очень широкий круг интересов. Есть люди, которые сосредоточены на области как таковой, но я всегда считаю решение проблем междисциплинарным вопросом. Я обращаю внимание на все виды исследований. С другой стороны, на меня также повлиял мой опыт работы в лаборатории Intel, где проводились исследования по многим вещам, включая робототехнику и HD. Я начал изучать и другие исследования. Для ученого многопрофильная компания может помочь вам развить более богатую перспективу, что особенно хорошо для развития карьеры.

Синхронизировано. Как вы относитесь к шумихе вокруг глубокого обучения? Есть люди, которые скептически относятся к его узким местам. Большая часть ваших предыдущих исследований сочетала глубокое обучение с традиционными технологиями компьютерного зрения.

Сяофэн Рен: Глубокое обучение, несомненно, добилось революционного прогресса и в значительной степени расширило наши возможности. Однако есть такие люди, как я, которые давно погружены в эту область, и у нас есть свой поток идей, и мы чувствуем, что глубокого обучения недостаточно для решения многих проблем. Нам нужен еще один прорыв, или идти вперед и исследовать для себя.

Синхронизировано. Исходя из прошлого опыта работы, какова связь между фундаментальными исследованиями и разработкой продукта?

Сяофэн Рен: Это зависит от компании, команды или конкретного проекта, над которым вы работаете. Вообще говоря, я хочу, чтобы продукты лидировали, но в то же время чтобы у команды R&D было пространство для чего-то еще.

Синхронизировано. Нужно ли совмещать базовые исследования и разработку продуктов?

Сяофэн Рен: Конечно. У разных компаний разные подходы. Amazon, например, не полагается исключительно на фундаментальные исследования или разработку продуктов, они действительно взаимосвязаны. Продукция постоянно меняется и обновляется.

Журналист:Ян Лю | Локализация: Меган Хан | Редактор:Майкл Саразен

Нажмите, чтобы прочитать эту статью на китайском языке.