Моят първи урок за AI Blueprints разгледа типовете препоръчителни системи и как да създам препоръчителна система с помощта на Blueprint без писане на моделен код. Един от научените уроци беше колко лесно е да се създаде и мащабира ML тръбопровод. AI Blueprints може да се използва не само за създаване на системи за препоръки, но може да се използва и за NLP, компютърно зрение, откриване на аномалии и др. Този конкретен урок ще разгледа:

  • Какво е анализ на настроението
  • Как да използвате AI Blueprints, за да изтеглите живи данни от Twitter и да анализирате настроенията им, без да пишете код

Какво е анализ на настроението

Според Уикипедия анализът на настроението е използването на обработка на естествен език, анализ на текст, компютърна лингвистика и биометрия за систематично идентифициране, извличане, количествено определяне и изучаване на афективни състояния и субективна информация. Може да се използва за подобряване на клиентското изживяване, намаляване на текучеството на служители, създаване на по-добри продукти и много повече. Данните, използвани за анализ на настроението, могат да бъдат в много различни форми. Например обратната връзка с клиентите обикновено идва в две различни форми: структурирана и неструктурирана.

Например рецензиите на Amazon са структурирани, като оценките са добър заместител на настроенията на клиентите.

Много от данните в света обаче са неструктурирани. Например данните в Twitter не идват с оценка.

Използване на AI Blueprints за анализиране на настроенията в Twitter без писане на код

В този урок ще използваме анализ на настроението, за да идентифицираме емоцията зад данните в Twitter. По-конкретно ще разгледаме дали конкретен хаштаг #MayTheFourth (Денят на Междузвездни войни съдържа положителни, отрицателни или неутрални настроения. За да получите достъп до данни в Twitter, ще ви е необходим акаунт на програмист в Twitter, който можете да научите да настроите тук. Забележка че ако искате да направите анализ на настроението върху вашите собствени данни, ще ви трябват етикетирани данни за текстове и тяхното съвпадащо настроение, което този урок не покрива.

По-долу е общ процес на анализ на настроенията, който AI чертежите правят зад кулисите.

Нашият бизнес случай за този урок е да оценим общото настроение в Twitter за дадена тема (хаштаг), която можете да видите на изображението по-долу. Естествено, това може да бъде сложно.

За щастие, нашият AI Blueprint ще се погрижи за цялата тази обработка на данни и ще даде цялостната полярност на туитовете с едно кликване.

Избор на план

За да можете да следвате тази част от урока, ще трябва да се регистрирате или да влезете в cnvrg.io Metacloud. След като създадете потребителско име, ще получите екран, подобен на този по-долу.

Следващата стъпка е да изберете Чертежи.

Следващият тип в настроението.

Кликнете върху Twitter Sentiment Analysis.

След това щракнете върху Използване на план и ще видите диаграма на потока.

Този план се състои от следните компоненти:

  • Конектор за Twitter: Този конектор ви позволява да въведете своя токен на носител и хаштага, който ви интересува. Ние ще направим изхода от това csv файл. Ако не сте сигурни какво е Bearer token и как да го получите, моля, вижте тази публикация на общността на cnvrg.io в Twitter API.
  • Batch Predict: В този план csv файлът от Twitter Connector ще бъде въведен в предварително обучен модел в Batch Predict, който ще прави прогнози. Тези прогнози се състоят от положително или отрицателно настроение, както и оценка на настроението.

Конектор за Twitter

Кликнете върху Twitter Connector.

Ще трябва да въведете 4 стойности.

  • token: Това е Bearer Token, който получавате от API на Twitter (вашият ще бъде различен от моя).
  • термин: Това е хаштагът, който ви интересува. В този урок се интересуваме от Деня на Междузвездни войни (Четвърти май).
  • набор от данни: нарекох го twittdata. Това е най-вече за организационни цели.
  • output_file: Това е името на изходния файл, който съдържа всички данни за нашия термин (хаштаг). Batch Predict ще трябва да прочете този файл. В този урок го нарекохме twitter.csv.

Имайте предвид, че има и други стойности, които можете да въведете, като max_twitts (колко туита искате до) и days_back (отпреди колко дни искате туитовете). Кликнете върху Запазване на промените. Конекторът на Twitter в диаграмата на потока вече трябва да изглежда попълнен.

Пакетно прогнозиране

Кликнете върху Batch Predict.

Няма да е необходимо да въвеждаме стойности тук. Обърнете внимание, че името на input_file трябва да е същото като output_file от Twitter Connector. Щракнете върху Запазване на промените и след това върху Изпълнение.

В зависимост от разпределените ресурси, изпълнението може да отнеме известно време. Ако видите завършено, последователно сте направили анализатор на настроението!

Въпреки че това е страхотно, вероятно искате да видите резултатите (predictions.csv).

Преглед на резултатите

За да видите резултатите, щракнете върху Batch Predict и след това върху Artifacts и превъртете до дъното. Ще видите predictions.csv. Препоръчвам ви да щракнете върху ангажимента (bed9b357 на изображението по-долу).

Препоръчвам ви да щракнете върху ангажимента (bed9b357 на изображението по-горе).

След това кликнете върху прогнозите. Ще можете да видите настроението и резултата.

Заключение

Тази публикация разгледа анализа на настроението в Twitter с чертежи на AI. Имайте предвид, че е много лесно да правите други невероятни неща с AI Blueprints като „системи за препоръчване“, обобщаване на текст, компютърно зрение и много други. Ако искате да споделите какво сте направили с AI Blueprints, можете да публикувате за това в cnvrg.io community или @cnvrg_io в twitter.

Този урок е базиран на семинар на cnvrg.io. Видео от уъркшопа можете да гледате тук.

Първоначално публикувано на https://cnvrg.io/twitter-sentiment-analysis/.