Новости науки о данных: 10–03

Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем каждая история. Если вам нужна дополнительная информация по конкретной истории, просто нажмите на нее, чтобы прочитать всю статью.

Вы можете увидеть другие темы, которые у нас есть, для новостей, доступные здесь, и подписаться на рассылку новостей, которые вас интересуют.

Novartis создает лабораторию инноваций в области искусственного интеллекта и использует Microsoft в качестве стратегического партнера в области искусственного интеллекта и обработки данных

Особенности:

Novartis объявила о создании инновационной системы искусственного интеллекта Novartis и сформировала стратегическое многолетнее партнерство в области исследований и разработок с Microsoft, чтобы переосмыслить медицину с помощью искусственного интеллекта (AI).
Объединив огромное количество наборов данных Novartis с передовыми решениями Microsoft для искусственного интеллекта, лаборатория будет стремиться создать новые модели и приложения искусственного интеллекта, которые могут расширить возможности наших сотрудников для решения следующей волны проблем в медицине.
Совместная исследовательская деятельность будет включать совместную работу в кампусе Novartis (Швейцария), в Глобальном сервисном центре Novartis в Дублине и в исследовательской лаборатории Microsoft (Великобритания), начиная с :.
Эти проблемы являются ключевыми факторами, побуждающими Novartis и Microsoft объединиться, чтобы изучить, как найти новые способы решения проблемы разработки лекарств, используя технологию искусственного интеллекта Microsoft в сочетании с обширным опытом Novartis в области наук о жизни.
Сочетание наших глубоких знаний в области биологии человека и медицины с ведущим опытом Microsoft в области искусственного интеллекта может изменить наш подход к открытию и разработке лекарств для всего мира », - сказал Вас Нарасимхан, генеральный директор Novartis.

Мы должны использовать искусственный интеллект - вот почему

Особенности:

Этот пример призван проиллюстрировать важную истину об ИИ: хотя наши развивающиеся интеллектуальные технологии имеют множество недостатков, если мы не будем бдительно следить за их развитием, искусственный интеллект также обладает огромным потенциалом для преобразования нашего мира к лучшему.
Перечисление всех возможных способов, с помощью которых искусственный интеллект, машинное обучение и связанные с ними технологии могут положительно повлиять на наше будущее, занял бы множество книг.
Прогнозирование и сокращение разрушений в результате стихийных бедствий - это лишь одна из областей потенциала, но ИИ открывает огромные перспективы практически во всех областях обучения и науки.
Avantgarde Analytics использует машинное обучение, чтобы связывать граждан с интересующими их делами, помогая выстраивать социальные движения и отношения между законодателями и общественностью.
Даррелл М. Уэст и Джон Р. Аллен, Как искусственный интеллект трансформирует мир, Институт Брукингса, 24 апреля 2018 г., www.brookings.edu/research/how-artificial-intelligence-is-transforming-the-world .

Развертывание модели машинного обучения

Особенности:

Действительно, промышленная система машинного обучения является частью обширной инфраструктуры данных, которая делает непрерывный рабочий процесс машинного обучения особенно сложным.
Доклад, который я посетил, «Развертывание модели машинного обучения: стратегия к реализации» был проведен экспертами Cloudera Джастином Норманом и Сагаром Кевальрамани.
Отслеживание моделей машинного обучения в производстве позволяет специалистам по обработке данных повторно оценить модели и пересмотреть выбранный алгоритм обучения.
Наиболее примечательным вариантом, о котором шла речь в ходе выступления, является Cloudera Data Science Workbench (CDSW), который интегрируется с широко используемыми платформами данных CDH и HDP.
Интересным вариантом для проектов машинного обучения в кластере Hadoop является Hadoop Submarine от Apache, который я обнаружил во время другого выступления, Hadoop {Submarine} Project: выполнение рабочих нагрузок глубокого обучения на YARN, представленного Сунил Говинданом и Жанкуном Тангом.

Использование теории игр и децентрализации для масштабирования моделей многоагентного обучения с подкреплением

Особенности:

Даже в распределенных сценариях, таких как многоагентное обучение с подкреплением (MARL), которое может включать десятки тысяч узлов, на которых выполняется модель, модели обучения полагаются на несколько централизованных узлов.
Если каждому агенту необходимо собрать данные, отправить их на центральный сервер и взаимодействовать с ним для оптимизации своей политики обучения, сложность архитектуры возрастает линейно с количеством агентов.
В прошлом году исследователи из компании Prowler.io, занимающейся искусственным интеллектом (ИИ), опубликовали статью, в которой они представили метод так называемого «распределенного обучения с подкреплением критиков и действующих лиц».
Поскольку агентам необходимо изучить новые задачи, центральный координатор вынужден координировать политику обучения для произвольного количества узлов в сети.
Принцип обучения схожести задач в основном означает, что, если агент RL изучает определенную политику задачи, другие агенты в сети, выполняющие аналогичные задачи, могут использовать эту политику.

Внедрение науки о данных и машинного обучения на крупных предприятиях

Особенности:

Наука о данных и машинное обучение развиваются быстрыми темпами, поскольку все больше и больше компаний, независимо от того, большие они или маленькие, стремятся расширить свое присутствие.
Поскольку у средних компаний не так много ресурсов, как у крупных игроков, или гибкости, как у мелких, они медленнее внедряют и внедряют технологии обработки и анализа данных и машинного обучения.
Однако организациям также необходимо нанять экспертов, обладающих навыками, знаниями или талантами в отношении использования инструментов науки о данных и машинного обучения.
Соучредитель и главный исследователь Dresner Advisory Services Говард Дреснер сказал, что более широкое использование науки о данных и машинного обучения помогло обогатить данные, которые используют некоторые из более традиционных инструментов бизнес-аналитики.
Таким образом, наука о данных и машинное обучение оказывают значительное влияние на предприятия любого размера и быстро становятся критически важными для дифференциации, а иногда и для выживания.

Создание воспроизводимых рабочих процессов в области науки о данных с помощью DVC

Особенности:

Современные решения машинного обучения требуют огромного количества файлов данных и тысяч строк кода для обработки данных и создания моделей машинного обучения.
Несмотря на то, что проекты по науке о данных и машинному обучению реализованы в программном обеспечении, они кардинально отличаются от разработки программного обеспечения общего назначения: например, DS в первую очередь ориентирована на эксперименты и имеет гораздо более высокий уровень внутренней непредсказуемости.
Хотя у нас есть только два исходных файла данных, для более крупных проектов могут быть десятки, тысячи или даже миллионы файлов данных, поэтому разумно создать для них отдельный каталог.
Во-вторых, происходит нечто более важное: DVC помещает файлы данных в свой кэш и создает два метафайла (data / train.csv.dvc и data / test.csv.dvc) с информацией об исходных файлах данных.
Обратите внимание, что Git ничего не знает о самих файлах данных, вся информация, необходимая для их отслеживания, хранится в файлах DVC, а Git служит инструментом верхнего уровня для отслеживания самого DVC.

ЯВА В ИСКУССТВЕННОМ РАЗВЕДЕНИИ

Особенности:

Сюда входит Apache Hadoop для распределенного управления данными; Apache Spark как распределенная среда выполнения для быстрого ETL; Apache Kafka как очередь сообщений; ElasticSearch, Apache Lucene и Apache Solr для поиска; и Apache Cassandra для хранения данных и многие другие.
Глубокое обучение - это современный уровень в решении большинства задач или машинного восприятия, включая классификацию, кластеризацию и прогнозирование, применяемые к необработанным сенсорным данным.
Обработка естественного языка (NLP) относится к приложениям, которые используют информатику, искусственный интеллект и вычислительную лингвистику для обеспечения взаимодействия между компьютерами и человеческими языками, как устными, так и письменными.
Проблемы обработки естественного языка часто связаны с пониманием естественного языка (NLU) и генерацией естественного языка (NLG), а также с соединением языка, машинного восприятия и диалоговых систем.
Машинное обучение включает в себя широкий спектр алгоритмов, которые могут адаптироваться под воздействием данных, включая случайные леса, машины с градиентным усилением, машины с вектором поддержки и другие.

Новости науки о данных: 10–03–2019

Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

Особенности:

Мы должны использовать искусственный интеллект - вот почему

Особенности:

Развертывание модели машинного обучения

Особенности:

Использование теории игр и децентрализации для масштабирования моделей многоагентного обучения с подкреплением

Особенности:

Внедрение науки о данных и машинного обучения на крупных предприятиях

Особенности:

Создание воспроизводимых рабочих процессов в области науки о данных с помощью DVC

Особенности:

ЯВА В ИСКУССТВЕННОМ РАЗВЕДЕНИИ

Особенности:

Подготовлено и спонсировано:

Инновационные решения в области науки о данных и расширенной аналитики

Новости науки о данных: 10–03–2019

Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Особенности:

Подготовлено и спонсировано:

Похожие вопросы