Моят първи урок за AI Blueprints разгледа типовете препоръчителни системи и как да създам препоръчителна система с помощта на Blueprint без писане на моделен код. Един от научените уроци беше колко лесно е да се създаде и мащабира ML тръбопровод. AI Blueprints може да се използва не само за създаване на системи за препоръки, но може да се използва и за NLP, компютърно зрение, откриване на аномалии и др. Този конкретен урок ще разгледа:
- Какво е анализ на настроението
- Как да използвате AI Blueprints, за да изтеглите живи данни от Twitter и да анализирате настроенията им, без да пишете код
Какво е анализ на настроението
Според Уикипедия анализът на настроението е използването на обработка на естествен език, анализ на текст, компютърна лингвистика и биометрия за систематично идентифициране, извличане, количествено определяне и изучаване на афективни състояния и субективна информация. Може да се използва за подобряване на клиентското изживяване, намаляване на текучеството на служители, създаване на по-добри продукти и много повече. Данните, използвани за анализ на настроението, могат да бъдат в много различни форми. Например обратната връзка с клиентите обикновено идва в две различни форми: структурирана и неструктурирана.
Например рецензиите на Amazon са структурирани, като оценките са добър заместител на настроенията на клиентите.
Много от данните в света обаче са неструктурирани. Например данните в Twitter не идват с оценка.
Използване на AI Blueprints за анализиране на настроенията в Twitter без писане на код
В този урок ще използваме анализ на настроението, за да идентифицираме емоцията зад данните в Twitter. По-конкретно ще разгледаме дали конкретен хаштаг #MayTheFourth (Денят на Междузвездни войни съдържа положителни, отрицателни или неутрални настроения. За да получите достъп до данни в Twitter, ще ви е необходим акаунт на програмист в Twitter, който можете да научите да настроите тук. Забележка че ако искате да направите анализ на настроението върху вашите собствени данни, ще ви трябват етикетирани данни за текстове и тяхното съвпадащо настроение, което този урок не покрива.
По-долу е общ процес на анализ на настроенията, който AI чертежите правят зад кулисите.
Нашият бизнес случай за този урок е да оценим общото настроение в Twitter за дадена тема (хаштаг), която можете да видите на изображението по-долу. Естествено, това може да бъде сложно.
За щастие, нашият AI Blueprint ще се погрижи за цялата тази обработка на данни и ще даде цялостната полярност на туитовете с едно кликване.
Избор на план
За да можете да следвате тази част от урока, ще трябва да се регистрирате или да влезете в cnvrg.io Metacloud. След като създадете потребителско име, ще получите екран, подобен на този по-долу.
Следващата стъпка е да изберете Чертежи.
Следващият тип в настроението.
Кликнете върху Twitter Sentiment Analysis.
След това щракнете върху Използване на план и ще видите диаграма на потока.
Този план се състои от следните компоненти:
- Конектор за Twitter: Този конектор ви позволява да въведете своя токен на носител и хаштага, който ви интересува. Ние ще направим изхода от това csv файл. Ако не сте сигурни какво е Bearer token и как да го получите, моля, вижте тази публикация на общността на cnvrg.io в Twitter API.
- Batch Predict: В този план csv файлът от Twitter Connector ще бъде въведен в предварително обучен модел в Batch Predict, който ще прави прогнози. Тези прогнози се състоят от положително или отрицателно настроение, както и оценка на настроението.
Конектор за Twitter
Кликнете върху Twitter Connector.
Ще трябва да въведете 4 стойности.
- token: Това е Bearer Token, който получавате от API на Twitter (вашият ще бъде различен от моя).
- термин: Това е хаштагът, който ви интересува. В този урок се интересуваме от Деня на Междузвездни войни (Четвърти май).
- набор от данни: нарекох го twittdata. Това е най-вече за организационни цели.
- output_file: Това е името на изходния файл, който съдържа всички данни за нашия термин (хаштаг). Batch Predict ще трябва да прочете този файл. В този урок го нарекохме twitter.csv.
Имайте предвид, че има и други стойности, които можете да въведете, като max_twitts (колко туита искате до) и days_back (отпреди колко дни искате туитовете). Кликнете върху Запазване на промените. Конекторът на Twitter в диаграмата на потока вече трябва да изглежда попълнен.
Пакетно прогнозиране
Кликнете върху Batch Predict.
Няма да е необходимо да въвеждаме стойности тук. Обърнете внимание, че името на input_file трябва да е същото като output_file от Twitter Connector. Щракнете върху Запазване на промените и след това върху Изпълнение.
В зависимост от разпределените ресурси, изпълнението може да отнеме известно време. Ако видите завършено, последователно сте направили анализатор на настроението!
Въпреки че това е страхотно, вероятно искате да видите резултатите (predictions.csv).
Преглед на резултатите
За да видите резултатите, щракнете върху Batch Predict и след това върху Artifacts и превъртете до дъното. Ще видите predictions.csv. Препоръчвам ви да щракнете върху ангажимента (bed9b357 на изображението по-долу).
Препоръчвам ви да щракнете върху ангажимента (bed9b357 на изображението по-горе).
След това кликнете върху прогнозите. Ще можете да видите настроението и резултата.
Заключение
Тази публикация разгледа анализа на настроението в Twitter с чертежи на AI. Имайте предвид, че е много лесно да правите други невероятни неща с AI Blueprints като „системи за препоръчване“, обобщаване на текст, компютърно зрение и много други. Ако искате да споделите какво сте направили с AI Blueprints, можете да публикувате за това в cnvrg.io community или @cnvrg_io в twitter.
Този урок е базиран на семинар на cnvrg.io. Видео от уъркшопа можете да гледате тук.
Първоначално публикувано на https://cnvrg.io/twitter-sentiment-analysis/.