Резултатите, които ще получите, след като анализирате вашите WhatsApp чатове, наистина ще ви изненадат

Чатовете в Whatsapp са богат източник на данни, които могат да бъдат използвани за получаване на по-задълбочена представа от данните. Използвах R за този анализ и създадох табло за лесен анализ с помощта на shiny. Rwhatsapp е мощен пакет, който е предназначен само да улесни анализа на чат WhatsApp. Чувствайте се свободни да прегледате статията, като просто разгледате сюжетите и визуализациите. Ако просто се интересувате да разберете общия преглед на проекта. Можете да намерите моя проект, хостван на

https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/.

Как да експортирате чат

Whatsapp ви позволява да експортирате вашите чатове в текстов файл. За да експортирате чатовете, изпълнете следните стъпки:

Почистване на данни

Първата част от всеки анализ на данни би била да се изчистят данните. Инсталирането и добавянето на Rwhatsapp ще бъде първата стъпка. Използвайки rwa_read() в този пакет, можете лесно да конвертирате текстовия файл в tibble.

Tibble, създаден от пакета rwhatsapp

Създаване на табло за управление

Ако просто търсите в Google Whatsapp чат анализ, ще намерите десетки уебсайтове и приложения, които ви предоставят много визуализация. Исках да предоставя допълнителен анализ и прозрения, които потребителят очаква.

  • Исках приложението ми автоматично да разпознава дали каченият чат е групов или е чат между 2 души и съответно да показва визуализации.
  • Като потребител, общият брой изпратени съобщения и усмивки не е от значение, освен ако не го сравните с друг човек или средното за групата. Следователно фокусът ми беше върху предоставянето на добри сравнения между 2 души или по отношение на средната стойност.
  • Исках хората да могат да избират продължителността на чатовете, които да бъдат анализирани, което им позволява да увеличат мащаба на определен период от време (Това ми помогна да разбера въздействието на Covid-19 върху честотата и разликата в нашите съобщения)

Затова използвах код, който вече беше споделен от Keagan Stokoe за основните визуализации, така че да мога да използвам ресурсите си за по-задълбочен анализ. Можете да намерите връзката към неговата статия тук. В света, в който живеем днес, наистина е полезно, ако не се налага винаги да започвате от нулата.

Основно сумиране

Таблиците са доста ясни. Той дава брой на общите съобщения, усмивки, медии и т.н. Заедно с някои средни показатели като ср. думи на съобщение и ср. знаци на съобщение. Доста елементарни неща. Обърнете внимание, че таблиците са малко по-различни за индивидуални и групови чатове.

Основна визуализация

Съобщенията се изпращат във времето

Можем да добием представа как честотата на съобщенията варира във времето. Разглеждайки този конкретен пример, очевидно е, че откакто блокирането беше наложено след Covid-19 през март 2020 г., честотата на чатовете се увеличи значително.

Кой изпраща най-много съобщения

Най-често използвани емотикони и думи

Съобщения за ден от седмицата и час от деня

Групата с вашите приятели има ли повече съобщения през уикенда или през делничния ден? В кой момент от деня сте склонни да изпращате повече съобщения? Това беше целта на тези диаграми.

Този конкретен чат показва, че в събота повечето съобщения се изпращат и повечето съобщения се изпращат в 22 часа.

Уникални думи от 3 букви

Облак от думи

Word Cloud също се показва за индивидуални чатове и групови чатове (както за групата като цяло, така и за конкретно лице в група), така че резюмето на текста, изпратен от човек/група, да бъде разбрано.

Експериментирах с добавянето на анализ на настроението на чатовете заедно с другите визуализации, но нямаше много смисъл, тъй като повечето ми чатове бяха на местни езици, които бяха въведени на английски.

Сравнения

Това е най-важната част от този анализ. Като потребител смятах, че е много по-добре да разбера данните, ако се показват като сравнение, а не като абсолютни стойности. Сравнителните таблици бяха различни за индивидуалния чат и груповия чат.

Сравнение в индивидуални чатове

Таблицата е доста разбираема. Зеленият цвят е даден за по-високата стойност и червеният за по-ниската стойност. Жълтото се дава, ако стойността е еднаква и за двата човека. Сега нека видим следващата таблица, която има по-задълбочен анализ.

Сравнения в групови чатове

Това работи точно по същия начин като предишната сравнителна таблица за отделни чатове. На мястото на второто лице трябва да се поставят средните стойности на чата, което дава следните таблици.

Генериране на отчет

Таблото също има опция за експортиране на резултатите от анализа като HTML файл, който може лесно да се споделя с приятели. Образец на експортирания файл може да се види тук. Това се прави с помощта на отчет R Markdown, чиито параметри са предадени от shiny.

Сървърният файл на shiny:

Код за файл R-Markdown:

Разположено табло за управление

Можете да намерите таблото за управление, което създадох тук: https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/

Заключение

Мисленето от гледна точка на потребителите преди разработването на приложения наистина помага. Беше наистина страхотно, когато много приятели казаха, че са намерили сравненията и таблицата за анализ много интересни. Това е най-добрата възвръщаемост, която можете да очаквате след създаване на приложение.

Това също ме накара да осъзная богатото количество данни, което присъства само в един чат. От гледна точка на Whatsapp, те биха могли да получат някои много добри данни, дори без да се налага да знаят какво съобщение се изпраща (E2E криптиране). Данни като клеймото за време, в което се изпращат съобщенията и кога се четат съобщенията и времето, когато някой е онлайн и много, много повече. Whatsapp ще използва всички тези прозрения, за да разработи продукта. Но това не крие факта, че даваме адски много данни на компаниите, когато използваме техните продукти.