Наскоро имах възможността да се явя на изпита AWS Machine Learning Specialty и исках да споделя своя опит и някои съвети, които намерих за полезни при подготовката за изпита.

ЗАБЕЛЕЖКА: Всички мнения са мои и не отразяват тези на моя работодател

Първо и най-важно е да имате солидна основа в концепциите и техниките за машинно обучение. Това включва разбиране на различните типове алгоритми, как работят и кога да ги използвате.

В допълнение към тази основа също е важно да имате практически опит с машинното обучение на платформата AWS. Това включва използването на AI услуги като Amazon SageMaker, Amazon Comprehend, Amazon Kendra(и т.н.), както и разбиране как да разположите модели за машинно обучение в производствена среда.

10%от изпита се фокусира върху аналитични услуги, така че е изключително важно да разберете добре технологиите за приемане, обработка на данни и визуализация на данни. Прочетете повече за това тук.

За да се подготвя за изпита, се съсредоточих върху изучаването на няколко основни части от материала и провеждането на практически изпити, вместо да се гмуркам във всеки дребен детайл, тъй като намерих този подход за по-ефективен във времето.

(1) Вградени алгоритми

За да се подготвя за изпита, проучих многото вградени алгоритми, като ги разделих на контролирани и неконтролирани категории и след това изброих обичайни случаи на употреба за всеки. Този подход ми помогна да идентифицирам по-добре моделите в изпита и как те могат да бъдат приложени в различни ситуации. ЗАБЕЛЕЖКА: Изображението, което направих по-долу, не включва ВСИЧКИ вградени алгоритми на AWS. Вижте тук за пълния списък.

(2) Концепцията за недостатъчно оборудване срещу свръхоборудване

Разбирането на разликите между недостатъчно оборудване и прекомерно оборудване е от решаващо значение в областта на машинното обучение, тъй като може да окаже значително влияние върху точността и ефективността на даден модел. Недостатъчно приспособяване възниква, когато моделът е твърде прост и не е в състояние да улови сложността на данните, което води до лошо представяне както на данните за обучение, така и на тестовите данни. От друга страна, пренастройване възниква, когато моделът е твърде сложен и е в състояние да пасне идеално на данните за обучение, но се представя лошо на тестовите данни.

Създадох таблицата по-долу като бърза справка, за да отговарям на въпроси по време на изпита, тъй като се появяваше доста по време на тренировъчните изпити!

(3) Метрики за класификация на ML

Има няколко общи показателя, които се използват за оценка на ефективността на класификационен модел на машинно обучение:

  1. Точност: Това е най-простият показател и той просто измерва процента на прогнозите, които моделът е получил правилно.

2. Прецизност: Това измерва дела на положителните прогнози, които действително са правилни.

3. Припомняне: Това измерва дела на действителните положителни случаи, които моделът е успял да идентифицира правилно.

4. Резултат F1: Това е среднопретеглена стойност на прецизност и припомняне и често се използва като единична метрика за сравняване на класификатори.

5. Крива на AUC-ROC: Това е графично представяне на производителността на модела и показва компромиса между истинската положителна честота и фалшивата положителна скорост.

6. Матрица на объркването: Това е таблица, която показва броя на истински положителни, истински отрицателни, фалшиво положителни и фалшиво отрицателни прогнози, направени от модела.

(4) Amazon Sagemaker

Amazon SageMaker е напълно управлявана платформа за машинно обучение, която предоставя набор от инструменти и услуги за изграждане, обучение и внедряване на модели за машинно обучение. Дадох най-голям приоритет научаването на тази услуга.

Плейлистът на Amazon Sagemakertв YouTube е чудесен ресурс за изучаване на машинно обучение и как да използвате Amazon Sagemaker за изграждане и внедряване на модели.

Официалната документация на AWS също е ценен ресурс, тъй като предоставя подробна информация за различните функции и възможности на Amazon Sagemaker. Ако предпочитате по-практичен подход, Курсът на Stephan Maarek за Udemy е чудесен вариант, тъй като предоставя ръководство стъпка по стъпка за изграждане и внедряване на модели за машинно обучение с помощта на Amazon Sagemaker. Освен това Денят за потапяне в Amazon Sagemaker е фантастична възможност да научите за всички основни функции на платформата и да придобиете малко практически опит в работата с нея.

(5) Техники за проектиране на функции

Инженерингът на функции е важна стъпка в процеса на машинно обучение, тъй като качеството на функциите, използвани за обучение на модел, може значително да повлияе на неговата производителност. Добрите характеристики могат да помогнат на модела да направи по-точни прогнози, докато лошите или неуместни характеристики могат да попречат на способността му да учи и да взема ефективни решения. Чрез внимателно подбиране и създаване на подходящи функции, можем да дадем на нашия модел по-добро разбиране на проблема, който се опитваме да разрешим, и да подобрим способността му да обобщава нови, невиждани данни. В допълнение, инженерингът на функции може да помогне за намаляване на сложността на модела, което може да подобри неговата интерпретируемост и да улесни внедряването му в приложения от реалния свят.

Вижте таблицата, която направих по-долу, за да направите всички техники смилаеми, основното е да идентифицирате ключовите думи!

(6) AWS AI услуги

Важно е да се разберат различните услуги на AWS AI и техните възможности, за да се състави ефективно работен процес за конкретен сценарий. Например, ако една компания няма достъп до други ресурси за наука за данни, но все пак иска да извлече мнението на клиентите от новинарски статии,Amazon Comprehendможе да бъде добър избор. Тази услуга използва обработка на естествен език за анализиране на текст и идентифициране на чувствата, което я прави много подходяща за тази задача. Въпреки това, ако компанията иска да анализира и данни от социални медийни платформи, Amazon Rekognition може да е по-подходящ, тъй като е специализиран в анализ на изображения и видео. Познаването на възможностите на всяка услуга ви позволява да изберете най-подходящите инструменти за съответната задача, като гарантирате, че вашият работен процес е ефективен и ефективен.



Връзки към ресурси и практически изпити

Като цяло открих, че изпитът AWS Machine Learning Specialty е предизвикателен, но и много възнаграждаващ. Като отделих време и усилия за подготовка, успях да спечеля сертификата си и да разширя уменията и знанията си в областта на машинното обучение. Надявам се моят опит и съвети да помогнат на други, които се подготвят за изпита.