Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас.
News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем каждая история. Если вам нужна дополнительная информация по конкретной истории, просто нажмите на нее, чтобы прочитать всю статью.
Вы можете увидеть другие темы, которые у нас есть, для новостей, доступные здесь, и подписаться на рассылку новостей, которые вас интересуют.
Novartis создает лабораторию инноваций в области искусственного интеллекта и использует Microsoft в качестве стратегического партнера в области искусственного интеллекта и обработки данных
Особенности:
- Novartis объявила о создании инновационной системы искусственного интеллекта Novartis и сформировала стратегическое многолетнее партнерство в области исследований и разработок с Microsoft, чтобы переосмыслить медицину с помощью искусственного интеллекта (AI).
- Объединив огромное количество наборов данных Novartis с передовыми решениями Microsoft для искусственного интеллекта, лаборатория будет стремиться создать новые модели и приложения искусственного интеллекта, которые могут расширить возможности наших сотрудников для решения следующей волны проблем в медицине.
- Совместная исследовательская деятельность будет включать совместную работу в кампусе Novartis (Швейцария), в Глобальном сервисном центре Novartis в Дублине и в исследовательской лаборатории Microsoft (Великобритания), начиная с :.
- Эти проблемы являются ключевыми факторами, побуждающими Novartis и Microsoft объединиться, чтобы изучить, как найти новые способы решения проблемы разработки лекарств, используя технологию искусственного интеллекта Microsoft в сочетании с обширным опытом Novartis в области наук о жизни.
- Сочетание наших глубоких знаний в области биологии человека и медицины с ведущим опытом Microsoft в области искусственного интеллекта может изменить наш подход к открытию и разработке лекарств для всего мира », - сказал Вас Нарасимхан, генеральный директор Novartis.
Мы должны использовать искусственный интеллект - вот почему
Особенности:
- Этот пример призван проиллюстрировать важную истину об ИИ: хотя наши развивающиеся интеллектуальные технологии имеют множество недостатков, если мы не будем бдительно следить за их развитием, искусственный интеллект также обладает огромным потенциалом для преобразования нашего мира к лучшему.
- Перечисление всех возможных способов, с помощью которых искусственный интеллект, машинное обучение и связанные с ними технологии могут положительно повлиять на наше будущее, занял бы множество книг.
- Прогнозирование и сокращение разрушений в результате стихийных бедствий - это лишь одна из областей потенциала, но ИИ открывает огромные перспективы практически во всех областях обучения и науки.
- Avantgarde Analytics использует машинное обучение, чтобы связывать граждан с интересующими их делами, помогая выстраивать социальные движения и отношения между законодателями и общественностью.
- Даррелл М. Уэст и Джон Р. Аллен, Как искусственный интеллект трансформирует мир, Институт Брукингса, 24 апреля 2018 г., www.brookings.edu/research/how-artificial-intelligence-is-transforming-the-world .
Развертывание модели машинного обучения
Особенности:
- Действительно, промышленная система машинного обучения является частью обширной инфраструктуры данных, которая делает непрерывный рабочий процесс машинного обучения особенно сложным.
- Доклад, который я посетил, «Развертывание модели машинного обучения: стратегия к реализации» был проведен экспертами Cloudera Джастином Норманом и Сагаром Кевальрамани.
- Отслеживание моделей машинного обучения в производстве позволяет специалистам по обработке данных повторно оценить модели и пересмотреть выбранный алгоритм обучения.
- Наиболее примечательным вариантом, о котором шла речь в ходе выступления, является Cloudera Data Science Workbench (CDSW), который интегрируется с широко используемыми платформами данных CDH и HDP.
- Интересным вариантом для проектов машинного обучения в кластере Hadoop является Hadoop Submarine от Apache, который я обнаружил во время другого выступления, Hadoop {Submarine} Project: выполнение рабочих нагрузок глубокого обучения на YARN, представленного Сунил Говинданом и Жанкуном Тангом.
Использование теории игр и децентрализации для масштабирования моделей многоагентного обучения с подкреплением
Особенности:
- Даже в распределенных сценариях, таких как многоагентное обучение с подкреплением (MARL), которое может включать десятки тысяч узлов, на которых выполняется модель, модели обучения полагаются на несколько централизованных узлов.
- Если каждому агенту необходимо собрать данные, отправить их на центральный сервер и взаимодействовать с ним для оптимизации своей политики обучения, сложность архитектуры возрастает линейно с количеством агентов.
- В прошлом году исследователи из компании Prowler.io, занимающейся искусственным интеллектом (ИИ), опубликовали статью, в которой они представили метод так называемого «распределенного обучения с подкреплением критиков и действующих лиц».
- Поскольку агентам необходимо изучить новые задачи, центральный координатор вынужден координировать политику обучения для произвольного количества узлов в сети.
- Принцип обучения схожести задач в основном означает, что, если агент RL изучает определенную политику задачи, другие агенты в сети, выполняющие аналогичные задачи, могут использовать эту политику.
Внедрение науки о данных и машинного обучения на крупных предприятиях
Особенности:
- Наука о данных и машинное обучение развиваются быстрыми темпами, поскольку все больше и больше компаний, независимо от того, большие они или маленькие, стремятся расширить свое присутствие.
- Поскольку у средних компаний не так много ресурсов, как у крупных игроков, или гибкости, как у мелких, они медленнее внедряют и внедряют технологии обработки и анализа данных и машинного обучения.
- Однако организациям также необходимо нанять экспертов, обладающих навыками, знаниями или талантами в отношении использования инструментов науки о данных и машинного обучения.
- Соучредитель и главный исследователь Dresner Advisory Services Говард Дреснер сказал, что более широкое использование науки о данных и машинного обучения помогло обогатить данные, которые используют некоторые из более традиционных инструментов бизнес-аналитики.
- Таким образом, наука о данных и машинное обучение оказывают значительное влияние на предприятия любого размера и быстро становятся критически важными для дифференциации, а иногда и для выживания.
Создание воспроизводимых рабочих процессов в области науки о данных с помощью DVC
Особенности:
- Современные решения машинного обучения требуют огромного количества файлов данных и тысяч строк кода для обработки данных и создания моделей машинного обучения.
- Несмотря на то, что проекты по науке о данных и машинному обучению реализованы в программном обеспечении, они кардинально отличаются от разработки программного обеспечения общего назначения: например, DS в первую очередь ориентирована на эксперименты и имеет гораздо более высокий уровень внутренней непредсказуемости.
- Хотя у нас есть только два исходных файла данных, для более крупных проектов могут быть десятки, тысячи или даже миллионы файлов данных, поэтому разумно создать для них отдельный каталог.
- Во-вторых, происходит нечто более важное: DVC помещает файлы данных в свой кэш и создает два метафайла (data / train.csv.dvc и data / test.csv.dvc) с информацией об исходных файлах данных.
- Обратите внимание, что Git ничего не знает о самих файлах данных, вся информация, необходимая для их отслеживания, хранится в файлах DVC, а Git служит инструментом верхнего уровня для отслеживания самого DVC.
ЯВА В ИСКУССТВЕННОМ РАЗВЕДЕНИИ
Особенности:
- Сюда входит Apache Hadoop для распределенного управления данными; Apache Spark как распределенная среда выполнения для быстрого ETL; Apache Kafka как очередь сообщений; ElasticSearch, Apache Lucene и Apache Solr для поиска; и Apache Cassandra для хранения данных и многие другие.
- Глубокое обучение - это современный уровень в решении большинства задач или машинного восприятия, включая классификацию, кластеризацию и прогнозирование, применяемые к необработанным сенсорным данным.
- Обработка естественного языка (NLP) относится к приложениям, которые используют информатику, искусственный интеллект и вычислительную лингвистику для обеспечения взаимодействия между компьютерами и человеческими языками, как устными, так и письменными.
- Проблемы обработки естественного языка часто связаны с пониманием естественного языка (NLU) и генерацией естественного языка (NLG), а также с соединением языка, машинного восприятия и диалоговых систем.
- Машинное обучение включает в себя широкий спектр алгоритмов, которые могут адаптироваться под воздействием данных, включая случайные леса, машины с градиентным усилением, машины с вектором поддержки и другие.