Аналитический инструмент на основе Streamlit для более глубокого изучения аналитики вашего среднего профиля.

Я пишу на Medium уже около 3 лет и веду около 80 блогов об искусственном интеллекте и науке о данных. Поскольку Medium не платит индийским писателям, я никогда не считал Medium Premium обязательным требованием. Тем не менее, я всегда хотел иметь инструмент, который мог бы помочь мне глубже погрузиться в мои сообщения, чем то, что предоставляет Medium в своей бесплатной подписке.

Что дальше?

Используя Streamlit, я недавно пытался разработать такой аналитический инструмент, который может помочь техническим и нетехническим специалистам иметь промежуточную статистику наряду с некоторыми выводами, которые можно сделать.

Веб-приложение Streamlit: https://mehulgupta2016154-medium-profile-analyzer-about-4kgv5r.streamlitapp.com/

Пока все просто, приложение разделено на 2 части.

  • Общая аналитика
  • Единая аналитика блога

Общая аналитика

Цель этого раздела — дать агрегированные показатели. Ниже представлены разделы, представленные на данный момент

Хронология блогов

Учитывая год выпуска, эта функция отображает временную шкалу для всех блогов, выпущенных в этом году, с обложками и URL-адресами.

Лучшие блоги

Учитывая критерий (просмотр, количество прочтений, продолжительность чтения и т. д.), какой блог имеет наибольшее значение.

Блог %

Этот раздел предназначен для того, чтобы понять, какие блоги соответствуют заданному условию (например, 1000+ просмотров, 1000+ прочтений, 10+ голосов и т. д.).

Частота блогов, линейные графики для анализа темпа написания по годам/месяцам.

Облако слов над заголовками блогов, чтобы узнать, о чем вы пишете больше всего

Тепловая карта корреляции, чтобы понять, какие факторы влияют на ваш рост/снижение. Например, мой % чтения был ниже для блогов с большой длиной блогов. Это может свидетельствовать о том, что люди не любят читать длинные тексты.

Двухвариантная кластеризация для важных факторов. Вы также можете добавить другие комбинации

Распределение различных факторов с помощью диаграмм

Анализ одного блога

В этом разделе больше внимания уделяется конкретному блогу, который включает в себя

  • Облако слов на основе содержимого блога для выбранного блога

  • Краткая статистика по общему количеству просмотров, прочтений, голосов и т. д.
  • Ключевые слова с использованием Yake (неконтролируемая статистическая модель для извлечения ключевых слов из текста)

Сравнение блогов

Этот подраздел включает в себя сравнение двух блогов один на один на основе таких факторов, как общее количество просмотров, общее количество прочтений и т. д. Этот раздел также включает оценку сходства между двумя блогами с использованием

  • Предложение BERT для создания вложений предложений
  • Косинусное сходство

Многие из вас могут столкнуться с некоторыми сбоями в приложении, поскольку оно не тестировалось на многих пользователях. Пожалуйста, сообщайте о любых ошибках в этом посте или в репозитории git. В ближайшее время будут добавлены некоторые основные функции. Следите за обновлениями !!

К тому времени, прочитайте: