За какво говорят влиятелни хора в Twitter?

Twitter е страната на мошениците. Всички най-безумни глупости се казват в Twitter. Хора като Илон Мъск и марки като Wendy’s са си създали име чрез Twitter. Twitter ни позволява да видим какви са хората в действителност.

Сигурен съм, че има какво да научим от анализа на туитовете на някои от най-влиятелните хора в света. Създадох програма в Twitter, която изтегля туитове въз основа на дума за търсене и анализира текста. През следващите няколко месеца ще анализирам и ще се уча от известни хора в Twitter. Ето какво правя и как ще го направя. Този проект използва API на Twitter и The Text API.

Включени техники за обработка на естествен език

„Обработка на естествен език“ е обширна тема. Той включва много различни техники като определяне на „полярност на текста“, „разпознаване на именуван обект“ и разпознаване на „части на речта“. За този проект не се интересувам да правя само простите неща, въпреки че ще използваме полярност на текста. Ще правим малко по-сложно НЛП. Ще направим обобщение, ще намерим най-често срещаните фрази, най-често назоваваните обекти и ще разберем настроението/полярността.

AI Обобщение

Една от задачите, които ще изпълним, е да получим резюмето на туитовете. AI Text summarization използва NLP, за да ни получи резюме на текст. По този начин можем да добием представа какво се случва с туитовете, без да се налага да ги четем всичките.

Намиране на най-често срещаните фрази

НЛП също може да ни помогне да намерим най-често срещаните фрази. Най-често срещаните фрази от набор от туитове ни дават представа какво мисли потребителят за тази седмица. Подобно на резюмето, това ни дава бърз начин да вникнем в мислите на потребителя.

Намиране на най-често срещаните именувани обекти

Най-често срещаните наименувани обекти в набор от туитове ще ни дадат представа за кого, какво, кога и къде туитва потребителят. За да получим „най-често срещаните наименувани обекти“, трябва да получим именуваните обекти и след това да ги разделим и сортираме.

Настроения/Полярност

Този е по-основен. Можем просто да прекараме текста през почти всеки НЛП модел и да получим полярността. Полярност и чувство са повече или по-малко взаимозаменяеми думи. Получаването на настроението на набор от туитове ни казва колко положителни или отрицателни са били туитовете на потребителя през последната седмица.

Инфлуенсъри в Twitter, които ми е интересно да анализирам

Имах доста дълъг списък от хора, които исках да анализирам от Twitter. Трябваше да го намаля, защото някои от хората, които исках да анализирам като Опра, Тейлър Суифт и Джей Зи, не туитват достатъчно, за да получа приличен списък с туитове за тях всяка седмица. В крайна сметка избрах този списък.

  1. Илон Мъск – Той е луд в Twitter, искам да знам за какво говори. как туитне толкова много и въпреки това управлява куп успешни бизнеси?
  2. Бил Гейтс — Този човек беше чудовище през 80-те и 90-те с Microsoft. Сега той омекна, но всички знаем, че този човек пое софтуерната индустрия и всъщност имаше монопол за известно време. Любопитен съм за какво говори сега, туитва за някои важни неща като климата, книги за четене и други текущи събития.
  3. Том Билю — харесвам историята му. „Той се издигна от немотивиран учител до съосновател на стартиращ еднорог“. Сега той споделя знания чрез своите интервюта, които са страхотни. Той интервюира цял набор от интересни хора, които разширяват границите на човешкото познание.
  4. Стив Харви – По собствените му думи Стив Харви е „пич от капака, който излиза извън контрол“. Мисля, че този човек е забавен. Той е домакин на семейна вражда и постоянно прави нещата погрешни на Мис Вселена. Искам да знам какво казва.
  5. Марк Кюбан — Мисля, че за първи път видях Марк Кюбан в Shark Tank. Той казва доста интересни неща. Снимката му в Туитър е хубава, той пуши пура с подпряна настрани шапка. Напомня ми за Джордан.
  6. Гай Кавазаки — Гай Кавазаки основно прави това, което аз искам. Той е евангелист, аз съм технически евангелист. Той е азиатец, аз съм азиатец. Искам да бъда като този човек, така че, разбира се, ще го последвам и ще видя какво прави.
  7. Барак Обама – Той е най-следваният човек в Twitter към момента на писане. Освен това той е любимият президент в интернет. Вече направих доста анализи за него, които се фокусираха върху „медиите по време на неговото президентство“. Интересно ми е за какво говори самият човек.

Ако ви е харесала тази статия, моля, споделете в Twitter! За неограничен достъп до статии на Medium, регистрирайте се, за да станете Medium Member днес! Не забравяйте да ме последвате, Yujian Tang, за повече статии за технологията, обработка на естествен език и още!