Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем каждая история. Если вам нужна дополнительная информация по конкретной истории, просто нажмите на нее, чтобы прочитать всю статью.

Вы можете увидеть другие темы, которые у нас есть, для новостей, доступные здесь, и подписаться на рассылку новостей, которые вас интересуют.

Novartis создает лабораторию инноваций в области искусственного интеллекта и использует Microsoft в качестве стратегического партнера в области искусственного интеллекта и обработки данных

Особенности:

  • Novartis объявила о создании инновационной системы искусственного интеллекта Novartis и сформировала стратегическое многолетнее партнерство в области исследований и разработок с Microsoft, чтобы переосмыслить медицину с помощью искусственного интеллекта (AI).
  • Объединив огромное количество наборов данных Novartis с передовыми решениями Microsoft для искусственного интеллекта, лаборатория будет стремиться создать новые модели и приложения искусственного интеллекта, которые могут расширить возможности наших сотрудников для решения следующей волны проблем в медицине.
  • Совместная исследовательская деятельность будет включать совместную работу в кампусе Novartis (Швейцария), в Глобальном сервисном центре Novartis в Дублине и в исследовательской лаборатории Microsoft (Великобритания), начиная с :.
  • Эти проблемы являются ключевыми факторами, побуждающими Novartis и Microsoft объединиться, чтобы изучить, как найти новые способы решения проблемы разработки лекарств, используя технологию искусственного интеллекта Microsoft в сочетании с обширным опытом Novartis в области наук о жизни.
  • Сочетание наших глубоких знаний в области биологии человека и медицины с ведущим опытом Microsoft в области искусственного интеллекта может изменить наш подход к открытию и разработке лекарств для всего мира », - сказал Вас Нарасимхан, генеральный директор Novartis.

Мы должны использовать искусственный интеллект - вот почему

Особенности:

  • Этот пример призван проиллюстрировать важную истину об ИИ: хотя наши развивающиеся интеллектуальные технологии имеют множество недостатков, если мы не будем бдительно следить за их развитием, искусственный интеллект также обладает огромным потенциалом для преобразования нашего мира к лучшему.
  • Перечисление всех возможных способов, с помощью которых искусственный интеллект, машинное обучение и связанные с ними технологии могут положительно повлиять на наше будущее, занял бы множество книг.
  • Прогнозирование и сокращение разрушений в результате стихийных бедствий - это лишь одна из областей потенциала, но ИИ открывает огромные перспективы практически во всех областях обучения и науки.
  • Avantgarde Analytics использует машинное обучение, чтобы связывать граждан с интересующими их делами, помогая выстраивать социальные движения и отношения между законодателями и общественностью.
  • Даррелл М. Уэст и Джон Р. Аллен, Как искусственный интеллект трансформирует мир, Институт Брукингса, 24 апреля 2018 г., www.brookings.edu/research/how-artificial-intelligence-is-transforming-the-world .

Развертывание модели машинного обучения

Особенности:

  • Действительно, промышленная система машинного обучения является частью обширной инфраструктуры данных, которая делает непрерывный рабочий процесс машинного обучения особенно сложным.
  • Доклад, который я посетил, «Развертывание модели машинного обучения: стратегия к реализации» был проведен экспертами Cloudera Джастином Норманом и Сагаром Кевальрамани.
  • Отслеживание моделей машинного обучения в производстве позволяет специалистам по обработке данных повторно оценить модели и пересмотреть выбранный алгоритм обучения.
  • Наиболее примечательным вариантом, о котором шла речь в ходе выступления, является Cloudera Data Science Workbench (CDSW), который интегрируется с широко используемыми платформами данных CDH и HDP.
  • Интересным вариантом для проектов машинного обучения в кластере Hadoop является Hadoop Submarine от Apache, который я обнаружил во время другого выступления, Hadoop {Submarine} Project: выполнение рабочих нагрузок глубокого обучения на YARN, представленного Сунил Говинданом и Жанкуном Тангом.

Использование теории игр и децентрализации для масштабирования моделей многоагентного обучения с подкреплением

Особенности:

  • Даже в распределенных сценариях, таких как многоагентное обучение с подкреплением (MARL), которое может включать десятки тысяч узлов, на которых выполняется модель, модели обучения полагаются на несколько централизованных узлов.
  • Если каждому агенту необходимо собрать данные, отправить их на центральный сервер и взаимодействовать с ним для оптимизации своей политики обучения, сложность архитектуры возрастает линейно с количеством агентов.
  • В прошлом году исследователи из компании Prowler.io, занимающейся искусственным интеллектом (ИИ), опубликовали статью, в которой они представили метод так называемого «распределенного обучения с подкреплением критиков и действующих лиц».
  • Поскольку агентам необходимо изучить новые задачи, центральный координатор вынужден координировать политику обучения для произвольного количества узлов в сети.
  • Принцип обучения схожести задач в основном означает, что, если агент RL изучает определенную политику задачи, другие агенты в сети, выполняющие аналогичные задачи, могут использовать эту политику.

Внедрение науки о данных и машинного обучения на крупных предприятиях

Особенности:

  • Наука о данных и машинное обучение развиваются быстрыми темпами, поскольку все больше и больше компаний, независимо от того, большие они или маленькие, стремятся расширить свое присутствие.
  • Поскольку у средних компаний не так много ресурсов, как у крупных игроков, или гибкости, как у мелких, они медленнее внедряют и внедряют технологии обработки и анализа данных и машинного обучения.
  • Однако организациям также необходимо нанять экспертов, обладающих навыками, знаниями или талантами в отношении использования инструментов науки о данных и машинного обучения.
  • Соучредитель и главный исследователь Dresner Advisory Services Говард Дреснер сказал, что более широкое использование науки о данных и машинного обучения помогло обогатить данные, которые используют некоторые из более традиционных инструментов бизнес-аналитики.
  • Таким образом, наука о данных и машинное обучение оказывают значительное влияние на предприятия любого размера и быстро становятся критически важными для дифференциации, а иногда и для выживания.

Создание воспроизводимых рабочих процессов в области науки о данных с помощью DVC

Особенности:

  • Современные решения машинного обучения требуют огромного количества файлов данных и тысяч строк кода для обработки данных и создания моделей машинного обучения.
  • Несмотря на то, что проекты по науке о данных и машинному обучению реализованы в программном обеспечении, они кардинально отличаются от разработки программного обеспечения общего назначения: например, DS в первую очередь ориентирована на эксперименты и имеет гораздо более высокий уровень внутренней непредсказуемости.
  • Хотя у нас есть только два исходных файла данных, для более крупных проектов могут быть десятки, тысячи или даже миллионы файлов данных, поэтому разумно создать для них отдельный каталог.
  • Во-вторых, происходит нечто более важное: DVC помещает файлы данных в свой кэш и создает два метафайла (data / train.csv.dvc и data / test.csv.dvc) с информацией об исходных файлах данных.
  • Обратите внимание, что Git ничего не знает о самих файлах данных, вся информация, необходимая для их отслеживания, хранится в файлах DVC, а Git служит инструментом верхнего уровня для отслеживания самого DVC.

ЯВА В ИСКУССТВЕННОМ РАЗВЕДЕНИИ

Особенности:

  • Сюда входит Apache Hadoop для распределенного управления данными; Apache Spark как распределенная среда выполнения для быстрого ETL; Apache Kafka как очередь сообщений; ElasticSearch, Apache Lucene и Apache Solr для поиска; и Apache Cassandra для хранения данных и многие другие.
  • Глубокое обучение - это современный уровень в решении большинства задач или машинного восприятия, включая классификацию, кластеризацию и прогнозирование, применяемые к необработанным сенсорным данным.
  • Обработка естественного языка (NLP) относится к приложениям, которые используют информатику, искусственный интеллект и вычислительную лингвистику для обеспечения взаимодействия между компьютерами и человеческими языками, как устными, так и письменными.
  • Проблемы обработки естественного языка часто связаны с пониманием естественного языка (NLU) и генерацией естественного языка (NLG), а также с соединением языка, машинного восприятия и диалоговых систем.
  • Машинное обучение включает в себя широкий спектр алгоритмов, которые могут адаптироваться под воздействием данных, включая случайные леса, машины с градиентным усилением, машины с вектором поддержки и другие.

Подготовлено и спонсировано:

Инновационные решения в области науки о данных и расширенной аналитики