Результаты, которые вы получите после анализа чатов в WhatsApp, вас по-настоящему удивят.

Чаты WhatsApp - это богатый источник данных, который можно использовать для более глубокого понимания данных. Я использовал R для этого анализа и создал панель инструментов для удобного анализа с помощью shiny. Rwhatsapp - это мощный пакет, который разработан, чтобы упростить анализ чата WhatsApp. Не стесняйтесь пролистывать статью, просто рассматривая графики и визуализации. Если вам просто интересно разобраться в обзоре проекта. Вы можете найти мой проект, размещенный на

Https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/.

Как экспортировать чат

Whatsapp позволяет экспортировать ваши чаты в текстовый файл. Чтобы экспортировать чаты, выполните следующие действия:

Очистка данных

Первой частью любого анализа данных будет их очистка. Установка и добавление Rwhatsapp будет первым шагом. Используя rwa_read (), входящий в этот пакет, вы можете легко преобразовать текстовый файл в тиббл.

Тиббл, созданный пакетом rwhatsapp

Создание информационной панели

Если вы просто проведете анализ чата в Google Whatsapp, вы найдете десятки веб-сайтов и приложений, предоставляющих вам много визуализации. Я хотел предоставить дополнительный анализ и идеи, которых ожидает пользователь.

  • Я хотел, чтобы мое приложение автоматически определяло, является ли загруженный чат групповым или это чат между двумя людьми, и соответственно отображал визуализации.
  • Как пользователь, общее количество отправленных сообщений и смайлов не имеет значения, если вы не сравните его с другим человеком или средним значением по группе. Поэтому я сосредоточился на обеспечении хороших сравнений между двумя людьми или относительно среднего.
  • Я хотел, чтобы люди могли выбирать продолжительность чатов, которые должны быть проанализированы, что позволяет им приближаться к определенному периоду времени (это помогло мне понять влияние Covid-19 на частоту и разницу в наших сообщениях)

Поэтому я использовал код, который уже был предоставлен Keagan Stokoe для основных визуализаций, чтобы я мог использовать свои ресурсы для более глубокого анализа. Ссылку на его статью вы можете найти здесь. В сегодняшнем мире очень помогает, если не всегда нужно начинать с нуля.

Базовое суммирование

Таблицы говорят сами за себя. Он дает подсчет общего количества сообщений, смайлов, мультимедиа и т. Д. Наряду с некоторыми средними показателями, такими как среднее количество слов в сообщении и среднее количество символов в сообщении. Довольно простые вещи. Обратите внимание, как таблицы для индивидуальных и групповых чатов немного отличаются.

Базовая визуализация

Сообщения отправляются во времени

Мы можем понять, как частота сообщений меняется со временем. Глядя на этот конкретный пример, очевидно, что с тех пор, как в марте 2020 года после Covid-19 была введена изоляция, частота чатов значительно увеличилась.

Кто отправляет наибольшее количество сообщений

Чаще всего используются эмодзи и слова

Сообщений в день недели и час дня

У группы с друзьями больше сообщений в выходные или в будние дни? В какой день вы обычно отправляете больше сообщений? Это и было целью создания этих диаграмм.

Этот конкретный чат показывает, что по субботам отправляется большая часть сообщений, а большинство сообщений отправляется в 22:00.

Уникальные слова из 3 букв

Облако слов

Облако слов также отображается для отдельных чатов и групповых чатов (как для группы в целом, так и для конкретного человека внутри группы), так что сводка текста, отправленного человеком / группой, понятна.

Я экспериментировал с добавлением анализа настроений чатов вместе с другими визуализациями, но это не имело особого смысла, поскольку большинство моих чатов были на местных языках, набранных на английском.

Сравнения

Теперь это самая важная часть этого анализа. Как пользователь я чувствовал, что было бы намного лучше понять данные, если бы они были представлены в виде сравнения, а не абсолютных значений. Таблицы сравнения были разными для индивидуального и группового чатов.

Сравнение в индивидуальных чатах

Таблица довольно понятна. Зеленый цвет соответствует более высокому значению, а красный - более низкому значению. Желтый цвет дается, если значение одинаково для обоих людей. Теперь давайте посмотрим на следующую таблицу, в которой есть более глубокий анализ.

Сравнения в групповых чатах

Это работает точно так же, как и предыдущая сравнительная таблица для отдельных чатов. Вместо второго человека нужно поставить средние значения чата, что дает следующие таблицы.

Генерация отчетов

На панели инструментов также есть возможность экспортировать результаты анализа в виде HTML-файла, которым можно легко поделиться с друзьями. Образец экспортированного файла можно увидеть здесь. Это делается с помощью отчета R Markdown, параметры которого были переданы из shiny.

Серверный файл блестящий:

Код для файла R-Markdown:

Развернутая приборная панель

Вы можете найти панель управления, которую я создал здесь: https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/

Заключение

Подумайте с точки зрения пользователей, прежде чем разрабатывать приложения. Было очень здорово, когда многие друзья сказали, что им очень интересна таблица сравнений и анализа. Это лучшая прибыль, которую вы можете ожидать после создания приложения.

Это также заставило меня осознать, что в одном чате присутствует большой объем данных. С точки зрения Whatsapp, они смогут получать очень хорошие данные, даже не зная, какое сообщение отправляется (шифрование E2E). Такие данные, как отметки времени, в которые отправляются сообщения и когда сообщения читаются, время, когда кто-то находится в сети, и многое другое. Whatsapp будет использовать все эти идеи для разработки продукта. Но это не скрывает того факта, что мы передаем компаниям огромное количество данных при использовании их продуктов.