Най-новите статии за Data Science — алгоритмично подбрани, класирани и обобщени специално за вас.

News Flash е седмична публикация, която включва най-важните новини за конкретна тема. Историите са подготвени алгоритмично, оценени за качество и класирани, така че да можете да сте на върха на най-важните развития. Освен това, най-важните изречения за всяка история се извличат и показват като акценти, така че да можете да добиете представа за какво е всяка история. Ако искате повече информация за конкретна история, просто щракнете върху нея, за да прочетете цялата статия.

Можете да видите другите теми, за които имаме новини, за които разполагаме, „тук“ и да се регистрирате, за да получавате всички, които ви интересуват.

„Novartis ще създаде AI Innovation Lab, използвайки Microsoft като стратегически партньор за AI & Data Science“

Акценти:

  • Novartis обяви създаването на иновацията на Novartis AI и формира стратегическо многогодишно партньорство за изследвания и разработки с Microsoft за преосмисляне на медицината чрез изкуствен интелект (AI).
  • Чрез обединяването на огромни количества набори от данни на Novartis с усъвършенстваните AI решения на Microsoft, лабораторията ще се стреми да създаде нови AI модели и приложения, които могат да увеличат възможностите на нашите сътрудници да се справят със следващата вълна от предизвикателства в медицината.
  • Съвместните изследователски дейности ще включват среди за съвместна работа в Novartis Campus (Швейцария), в Novartis Global Service Center в Дъблин и в Microsoft Research Lab (UK), започвайки с:.
  • Тези предизвикателства са ключовите двигатели за обединяването на Novartis и Microsoft, за да проучат как да намерят нови начини за справяне с разработването на лекарства чрез използване на AI технологията на Microsoft, комбинирана със стабилния опит на Novartis в областта на науките за живота.
  • Съчетаването на дълбоките ни познания по човешка биология и медицина с водещия експертен опит на Microsoft в областта на изкуствения интелект може да промени начина, по който откриваме и разработваме лекарства за света“, каза Вас Нарасимхан, главен изпълнителен директор на Novartis.

„Трябва да прегърнем изкуствения интелект – ето защо“

Акценти:

  • Този пример има за цел да илюстрира една важна истина за ИИ: докато нашите нововъзникващи интелигентни технологии имат много недостатъци, ако не наблюдаваме внимателно тяхното развитие, изкуственият интелект също притежава изключителен потенциал да трансформира нашия свят към по-добро.
  • Изброяването на всички бъдещи начини, по които изкуственият интелект, машинното обучение и свързаните с тях технологии биха могли да повлияят положително на нашето бъдеще, би запълнило много книги.
  • Прогнозирането и намаляването на разрушенията от природни бедствия е само една област с потенциал, но ИИ има огромно обещание в почти всяка област на обучението и науката.
  • Avantgarde Analytics използва машинно обучение, за да свърже гражданите с каузите, които ги интересуват, като помага за изграждането на социални движения и взаимоотношения между законодателите и обществеността.
  • Дарел М. Уест и Джон Р. Алън, „Как изкуственият интелект трансформира света“, Институт Брукингс, 24 април 2018 г., www.brookings.edu/research/how-artificial-intelligence-is-transforming-the-world .

„Внедряване на модел на машинно обучение“

Акценти:

  • Наистина, индустриална система за машинно обучение е част от обширна инфраструктура за данни, което прави работния процес от край до край на ML особено сложен.
  • Беседата, на която присъствах, Разгръщане на модела за машинно обучение: Стратегия към внедряване, беше изнесена от експертите на Cloudera, Джъстин Норман и Сагар Кевалрамани.
  • Проследяването на ML модели в производството позволява на специалистите по данни да преоценят моделите и да преразгледат избрания алгоритъм за обучение.
  • Най-забележителната опция, която беше представена по време на разговора, е Cloudera Data Science Workbench (CDSW), която се интегрира с често използваните платформи за данни CDH и HDP.
  • Интересна опция за ML проекти на Hadoop клъстер е Hadoop Submarine на Apache, който открих по време на друг разговор, Hadoop {Submarine} Project: Running Deep Learning Workloads on YARN даден от Sunil Govindan и Zhankun Tang.

„Използване на теория на игрите и децентрализация за мащабиране на модели за обучение за подсилване на множество агенти“

Акценти:

  • Дори в разпределени сценарии като мултиагентно подсилващо обучение (MARL), които могат да включват десетки хиляди възли, изпълняващи модел, моделите за обучение разчитат на шепа централизирани възли.
  • Ако всеки агент трябва да събере данните, да ги изпрати до централен сървър и да взаимодейства с него, за да оптимизира своята политика за обучение, сложността на архитектурата нараства линейно с броя на агентите.
  • Миналата година изследователи от мощната компания за изкуствен интелект (AI) Prowler.io публикуваха документ, в който представиха метод за това, което нарекоха „Разпределено обучение за укрепване на актьори и критики“.
  • Тъй като агентите трябва да научат нови задачи, централният координатор е принуден да координира политиките за обучение между произволен брой възли в мрежата.
  • Принципът на обучение за подобие на задачи основно означава, че ако RL агент научи конкретна политика за задача, други агенти в мрежата, изпълняващи подобни задачи, могат да използват тази политика.

„Внедряване на наука за данни и машинно обучение в предприятия от всякакъв размер“

Акценти:

  • Науката за данни и машинното обучение се разрастват с бързи темпове, тъй като все повече компании, независимо дали са големи или малки, се стремят да разширят обхвата си.
  • Тъй като нямат много ресурси като по-големите играчи или гъвкавост като по-малките, средните предприятия по-бавно приемат и внедряват технологии за наука за данни и машинно обучение.
  • Организациите обаче също трябва да наемат експерти, които имат умения, знания или таланти по отношение на използването на наука за данни и инструменти за машинно обучение.
  • Съосновател и главен изследовател в Dresner Advisory Services, Хауърд Дреснър каза, че увеличеното използване на науката за данни и машинното обучение е помогнало за обогатяване на данните, които използват някои от по-традиционните инструменти за бизнес разузнаване.
  • И така, науката за данните и машинното обучение оказват значително въздействие върху бизнеса с всякакъв размер и бързо стават критични за диференциацията и понякога за оцеляването.

„Създаване на възпроизводими работни процеси за наука за данни с DVC“

Акценти:

  • Съвременните решения за машинно обучение изискват огромен брой файлове с данни и хиляди редове код за обработка на данните и създаване на ML модели.
  • Въпреки че са внедрени в софтуера, проектите за наука за данни и машинно обучение са драстично различни от разработката на софтуер с общо предназначение: например DS е предимно експериментално управляван и има много по-високо ниво на присъща непредсказуемост.
  • Въпреки че имаме само два оригинални файла с данни, за по-големи проекти може да има десетки, хиляди или дори милиони файлове с данни, така че е разумно да имате отделна директория за тях.
  • Второ, случва се нещо по-важно: DVC поставя файлове с данни в своя кеш и създава два метафайла (data/train.csv.dvc и data/test.csv.dvc) с информацията за оригиналните файлове с данни.
  • Имайте предвид, че Git не знае нищо за самите файлове с данни, цялата информация, необходима за тяхното проследяване, се съхранява в DVC файлове, докато Git служи като инструмент от по-високо ниво за проследяване на самия DVC.

JAVA В ИЗКУСТВЕНИЯ ИНТЕЛЕКТ

Акценти:

  • Това включва Apache Hadoop за управление на разпределени данни; Apache Spark като разпределено време за изпълнение за бърз ETL; Apache Kafka като опашка за съобщения; ElasticSearch, Apache Lucene и Apache Solr за търсене; и Apache Cassandra за съхранение на данни, за да назовем само няколко.
  • Дълбокото обучение е най-модерното в повечето задачи или машинно възприятие, включващо класифициране, групиране и прогнозиране, приложено към необработени сензорни данни.
  • Обработката на естествен език (NLP) се отнася до приложения, които използват компютърни науки, AI и компютърна лингвистика, за да позволят взаимодействия между компютри и човешки езици, както говорими, така и писмени.
  • Предизвикателствата при обработката на естествен език често включват разбиране на естествен език (NLU) и генериране на естествен език (NLG), както и свързване на език, машинно възприятие и диалогови системи.
  • Машинното обучение обхваща широка гама от алгоритми, които са в състояние да се адаптират, когато са изложени на данни, това включва произволни гори, машини с градиентно усилване, машини с опорен вектор и други.

Произведено и спонсорирано от:

„Иновативни решения за наука за данни и напреднали анализи“