МАШИННО ОБУЧЕНИЕ (ML) В GOOGLE CLOUD

Подполе на изкуствения интелект, машинното обучение (ML) е навсякъде в днешния свят. Подобно на социалните приложения, които ви предлагат артикули за закупуване въз основа на вашето търсене, силата на данните се предоставя по нов начин. Той позволява на програмите или приложенията да се учат чрез опит, от събирането на данни. Машинното обучение помага да се правят прогнози въз основа на изграждането на алгоритъм, с други думи, този алгоритъм се учи от данните в итеративен процес. То не е самоотзивчиво, по-скоро е обучено да реагира.

Предимства на ML в облак

Има три основни играча в платформата за облачни изчисления, включително Amazon (AWS), Microsoft (Azure) и Google (GCP). Google представи своята нова платформа за машинно обучение през 2016 г., което позволява на TensorFlow да бъде достъпен за учени и разработчици на данни за базирано на облак машинно обучение. Основните играчи продължават да развиват ML иновациите.

От многото предимства на използването на облачната платформа пред традиционна система могат да бъдат подчертани следните:

  1. Обучение на големи количества данни с много изчислителна мощност
  2. Експериментиране с възможности за машинно обучение с възможност за мащабиране с увеличаване на търсенето
  3. Основният играч предоставя много опции за машинно обучение, които не изискват задълбочени познания по AI или теория на машинното обучение или екип от учени по данни

Тази статия се фокусира предимно върху контролирано машинно обучение, при което по време на обучението вие давате на вашия модел информация за обучение. След като вашият модел е обучен, той дава „предсказание“ като изход. Google използва машинно обучение от дълго време за свои собствени приложения като Google Keyboard, Google Photos, Google Maps, Google Chrome, Google Mail, Google Play Music, YouTube, между другото, и сега те дадоха своята технология на света изследвайте.

Машинното обучение в облака не изисква задълбочено проучване или изчислителни ресурси като първите дни на мисията. В днешно време всеки разработчик или учен по данни с компютър и проблем с машинното обучение може да получи изключителни резултати с облачни изчисления. Цикълът от край до край на модел за машинно обучение в GCP е показан на фигурата по-долу.

Как се извършва ML днес?

Машинното обучение в днешния свят се извършва главно от scikit learn, XGBoost, Keras или TensorFlow или може би писане на кодове в тетрадките на Jupyter. Предприятията, които обмислят ML, може да експериментират, изграждайки доказателство за концепции (PoC) или мащабират производство след обучение. Без значение какъв е съществуващият пакет от инструменти за ML, GCP се грижи за всичко. Освен това GCP предлага ресурси за разработчици на приложения, както и за учени по данни и практици в машинното обучение, независимо дали искат предварително обучени модели или персонализирани модели.

Услугата API за машинно обучение, предлагана от Google, е основно за разработчици, тъй като изисква по-малко познания за машинно обучение и API лесно се вгражда в приложения. ML API дава достъп до предварително обучени модели с една заявка за REST API.

През януари 2018 г. Google обяви своя нов ресурс за машинно обучение, наречен Cloud AutoML, който позволява на разработчиците с ограничен опит в машинното обучение да обучават висококачествени модели, специфични за техните бизнес нужди. Cloud AutoML е нещо средно между разработчиците на приложения и специалистите по данни. За да създавате персонализирани модели и да имате добър контрол върху машинното обучение, ML Cloud Engine е по-добра опция, тъй като ви позволява да обучавате и обслужвате вашия модел в мащаб.

Друга услуга, която има предвид не само учените по данни, но и софтуерните инженери и инженерите по данни, е Kubeflow. Ако екип иска да споделя модели и работни потоци на ML в рамките на организация, той може да използва тази услуга, тъй като тя интегрира модели в различни части на бизнеса.

И накрая, най-доброто решение „направи си сам“ (DIY) е GCE & GKE (Google Compute Engine & Google Kubernetes Engine). Ако имате ML рамка, различна от TensorFlow, и искате да използвате GCP услуги, GCE & GKE играят справедлива роля в тези случаи.

Можем да разберем разликите и къде могат да се използват услугите в реалния свят или в приложения, за да разберем по-добре необходимостта от прогнозиране.

Машинното обучение като API

GCP има 5 API, които дават достъп до предварително обучени модели за изпълнение на общи задачи за машинно обучение.

  1. Cloud Vision:

Cloud Vision API ви позволява да откривате текст в изображения OCR (оптично разпознаване на знаци), ръкопис в изображения (OCR), текст във файлове (OCR -PDF/TIFF), подсказки за изрязване, лица, свойства на изображението, етикети, ориентири, лога, множество обекти, изрично съдържание (SafeSearch), уеб обекти и страници, анотация на пакетно изображение офлайн, анотация на малък пакетен файл онлайн и офлайн чрез използване на облачно виждане с spring framework и base64-кодиране за изпращане на локално изображение.

  1. Облачна реч:

Прецизно преобразува речта в текст. Човек може да транскрибира съдържание с точни надписи. Може да бъде полезно да подобрите услугата, като получите информация от взаимодействията с клиентите.

2. Облачен естествен език:

Той помага при предоставянето на технологии за разбиране на естествения език, като анализ на настроението, анализ на настроението на обекта, разпознаване на обект и други текстови анотации.

3. Cloud Video Intelligence:

Този API помага на разработчиците да анотират видеоклипове, като използват функции като анализ на снимки за проследяване на обекти, етикетиране, откриване на изрично съдържание, проследяване на обекти, разпознаване на лога, разпознаване на текст, извършване на транскрипция на реч във видеоклипове, разпознаване на лица, разпознаване на лица, стрийминг анотация във видео файл и стрийминг анотация от поток на живо.

4. Облачен превод:

Този API помага за превода на текстове на над 100 езика за уебсайтове и приложения.

Някои от компаниите, които използват ML API в производство, са GIPHY, Hearst Newspapers, Descript, Seenit, Maslo и много други.

AutoML

AutoML влиза в действие, когато искате да обучите API на вашите собствени персонализирани данни. Например, това ще ви позволи да обучите модела върху вашите собствени данни за изображение. Някои от функциите му включват генериране на висококачествени данни за обучение, в които услугата за човешко етикетиране на Google може да коментира и почиства етикетите вместо вас, за да се увери, че моделите се обучават на висококачествени данни. Някои от продуктите на AutoML включват: AutoML Vision, AutoML Video Intelligence (Beta), AutoML Natural Language, AutoML Translation, AutoML Tables (Beta). Пример за компании, интегриращи AutoML Vision, са Disney, Urban Outfitters, ZSL и много други.

Cloud ML Engine:

Тази машина ще ви помогне да изпълните персонализирана задача за прогнозиране, специфична за вашия набор от данни или случай на употреба. Предлага услуги за обучение и прогнозиране и може да се използва заедно или поотделно. Инструментите за изграждане, обучение и обслужване на вашия собствен модел са TensorFlow и ML Engine. TensorFlow се използва за изграждане, а ML Engine за обучение и обслужване на моделите в мащаб. Внедряването на Cloud ML Engine трансформира бизнес компаниите, идентифициращи облаците в сателитни изображения, компаниите, гарантиращи безопасността на храните, и компаниите, които се грижат за удовлетвореността на клиентите и им отговарят четири пъти по-бързо с имейли.

Сложните модели могат да бъдат обучени чрез използване на мощността на GPU и TPU (Tensor Processing Unit — използван като AI ускорител, специфична за приложение интегрална схема, разработена от Google специално за NN). Като резултат, напълно обучен модел за машинно обучение става готов за хостване в други среди, включително локален и публичен облак. Освен това тази услуга може да се използва и при внедряване на модел, обучен във външни среди.

Фигурата по-долу показва стъпките, включени в обучението и прогнозирането от модел за машинно обучение, внедрен в Google Cloud ML Engine.

  1. Подготовка на данни
  2. Създаване на модел
  3. Модел обучение
  4. Внедряване на модела
  5. Монитор

Kubeflow

Ако вашият екип работи върху ML работни потоци, базирани на Kubernetes, тогава Kubeflow може да направи внедряването просто, преносимо и мащабируемо. Kubeflow Pipeline ви позволява да пренасяте данни в достъпен формат и изпълнява почистване на данни, анализира компоненти и обучени модели, мащабира обучените модели и много повече. Тръбопроводът Kubeflow се състои от:

  • UI (потребителски интерфейс) за управление на задания и проследяване на експерименти и изпълнения.
  • Той предлага двигател, който позволява да се планират многоетапни работни процеси на ML.
  • За манипулиране и дефиниране на тръбопроводи и компоненти получавате SDK (Комплект за разработка на софтуер).
  • Бележници за взаимодействие със система, която използва SDK.

ML в Google Cloud: Заключение

Откакто Google създаде TensorFlow с отворен код, той е най-широко използваният сред ML ентусиастите. И Amazon, и Microsoft поддържат TensorFlow и в своите ML услуги. Google предоставя добри услуги с общо предназначение и специализирани услуги за машинно обучение; от които можете да избирате и да използвате платформата, върху която вече работите. По това време рамката с най-широка поддръжка е TensorFlow, но това е бързо променяща се област и дори Google вече въведе поддръжка за scikit-learn и XGBoost.

Горещо препоръчвам да прочетете подробно този блог на адрес https://www.themigration.co/post/machine-learning-ml-on-google-cloud

The Migration Company, Мелбърн, разполага с обширен екип от членове, покриващи всички ресурси и услуги, от които се нуждаете за AI (изкуствен интелект) и задълбочено обучение и за трите платформи, независимо дали е GCP, AWS или Microsoft Azure. Ние редовно актуализираме нашите ресурси с новата технология въз основа на нуждите на нашите клиенти. Ако искате да знаете за интегрирането на някой от горните пътища с вашата технология, моля, уведомете ни. Всичко най-добро за вашите усилия за машинно обучение!