Результаты, которые вы получите после анализа чатов в WhatsApp, вас по-настоящему удивят.
Чаты WhatsApp - это богатый источник данных, который можно использовать для более глубокого понимания данных. Я использовал R для этого анализа и создал панель инструментов для удобного анализа с помощью shiny. Rwhatsapp - это мощный пакет, который разработан, чтобы упростить анализ чата WhatsApp. Не стесняйтесь пролистывать статью, просто рассматривая графики и визуализации. Если вам просто интересно разобраться в обзоре проекта. Вы можете найти мой проект, размещенный на
Https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/.
Как экспортировать чат
Whatsapp позволяет экспортировать ваши чаты в текстовый файл. Чтобы экспортировать чаты, выполните следующие действия:
Очистка данных
Первой частью любого анализа данных будет их очистка. Установка и добавление Rwhatsapp будет первым шагом. Используя rwa_read (), входящий в этот пакет, вы можете легко преобразовать текстовый файл в тиббл.
Тиббл, созданный пакетом rwhatsapp
Создание информационной панели
Если вы просто проведете анализ чата в Google Whatsapp, вы найдете десятки веб-сайтов и приложений, предоставляющих вам много визуализации. Я хотел предоставить дополнительный анализ и идеи, которых ожидает пользователь.
- Я хотел, чтобы мое приложение автоматически определяло, является ли загруженный чат групповым или это чат между двумя людьми, и соответственно отображал визуализации.
- Как пользователь, общее количество отправленных сообщений и смайлов не имеет значения, если вы не сравните его с другим человеком или средним значением по группе. Поэтому я сосредоточился на обеспечении хороших сравнений между двумя людьми или относительно среднего.
- Я хотел, чтобы люди могли выбирать продолжительность чатов, которые должны быть проанализированы, что позволяет им приближаться к определенному периоду времени (это помогло мне понять влияние Covid-19 на частоту и разницу в наших сообщениях)
Поэтому я использовал код, который уже был предоставлен Keagan Stokoe для основных визуализаций, чтобы я мог использовать свои ресурсы для более глубокого анализа. Ссылку на его статью вы можете найти здесь. В сегодняшнем мире очень помогает, если не всегда нужно начинать с нуля.
Базовое суммирование
Таблицы говорят сами за себя. Он дает подсчет общего количества сообщений, смайлов, мультимедиа и т. Д. Наряду с некоторыми средними показателями, такими как среднее количество слов в сообщении и среднее количество символов в сообщении. Довольно простые вещи. Обратите внимание, как таблицы для индивидуальных и групповых чатов немного отличаются.
Базовая визуализация
Сообщения отправляются во времени
Мы можем понять, как частота сообщений меняется со временем. Глядя на этот конкретный пример, очевидно, что с тех пор, как в марте 2020 года после Covid-19 была введена изоляция, частота чатов значительно увеличилась.
Кто отправляет наибольшее количество сообщений
Чаще всего используются эмодзи и слова
Сообщений в день недели и час дня
У группы с друзьями больше сообщений в выходные или в будние дни? В какой день вы обычно отправляете больше сообщений? Это и было целью создания этих диаграмм.
Этот конкретный чат показывает, что по субботам отправляется большая часть сообщений, а большинство сообщений отправляется в 22:00.
Уникальные слова из 3 букв
Облако слов
Облако слов также отображается для отдельных чатов и групповых чатов (как для группы в целом, так и для конкретного человека внутри группы), так что сводка текста, отправленного человеком / группой, понятна.
Я экспериментировал с добавлением анализа настроений чатов вместе с другими визуализациями, но это не имело особого смысла, поскольку большинство моих чатов были на местных языках, набранных на английском.
Сравнения
Теперь это самая важная часть этого анализа. Как пользователь я чувствовал, что было бы намного лучше понять данные, если бы они были представлены в виде сравнения, а не абсолютных значений. Таблицы сравнения были разными для индивидуального и группового чатов.
Сравнение в индивидуальных чатах
Таблица довольно понятна. Зеленый цвет соответствует более высокому значению, а красный - более низкому значению. Желтый цвет дается, если значение одинаково для обоих людей. Теперь давайте посмотрим на следующую таблицу, в которой есть более глубокий анализ.
Сравнения в групповых чатах
Это работает точно так же, как и предыдущая сравнительная таблица для отдельных чатов. Вместо второго человека нужно поставить средние значения чата, что дает следующие таблицы.
Генерация отчетов
На панели инструментов также есть возможность экспортировать результаты анализа в виде HTML-файла, которым можно легко поделиться с друзьями. Образец экспортированного файла можно увидеть здесь. Это делается с помощью отчета R Markdown, параметры которого были переданы из shiny.
Серверный файл блестящий:
Код для файла R-Markdown:
Развернутая приборная панель
Вы можете найти панель управления, которую я создал здесь: https://reubenjoseph13.shinyapps.io/Whatsapp_Analyzer/
Заключение
Подумайте с точки зрения пользователей, прежде чем разрабатывать приложения. Было очень здорово, когда многие друзья сказали, что им очень интересна таблица сравнений и анализа. Это лучшая прибыль, которую вы можете ожидать после создания приложения.
Это также заставило меня осознать, что в одном чате присутствует большой объем данных. С точки зрения Whatsapp, они смогут получать очень хорошие данные, даже не зная, какое сообщение отправляется (шифрование E2E). Такие данные, как отметки времени, в которые отправляются сообщения и когда сообщения читаются, время, когда кто-то находится в сети, и многое другое. Whatsapp будет использовать все эти идеи для разработки продукта. Но это не скрывает того факта, что мы передаем компаниям огромное количество данных при использовании их продуктов.