Аналитический инструмент на основе Streamlit для более глубокого изучения аналитики вашего среднего профиля.
Я пишу на Medium уже около 3 лет и веду около 80 блогов об искусственном интеллекте и науке о данных. Поскольку Medium не платит индийским писателям, я никогда не считал Medium Premium обязательным требованием. Тем не менее, я всегда хотел иметь инструмент, который мог бы помочь мне глубже погрузиться в мои сообщения, чем то, что предоставляет Medium в своей бесплатной подписке.
Что дальше?
Используя Streamlit, я недавно пытался разработать такой аналитический инструмент, который может помочь техническим и нетехническим специалистам иметь промежуточную статистику наряду с некоторыми выводами, которые можно сделать.
Веб-приложение Streamlit: https://mehulgupta2016154-medium-profile-analyzer-about-4kgv5r.streamlitapp.com/
Пока все просто, приложение разделено на 2 части.
- Общая аналитика
- Единая аналитика блога
Общая аналитика
Цель этого раздела — дать агрегированные показатели. Ниже представлены разделы, представленные на данный момент
Хронология блогов
Учитывая год выпуска, эта функция отображает временную шкалу для всех блогов, выпущенных в этом году, с обложками и URL-адресами.
Лучшие блоги
Учитывая критерий (просмотр, количество прочтений, продолжительность чтения и т. д.), какой блог имеет наибольшее значение.
Блог %
Этот раздел предназначен для того, чтобы понять, какие блоги соответствуют заданному условию (например, 1000+ просмотров, 1000+ прочтений, 10+ голосов и т. д.).
Частота блогов, линейные графики для анализа темпа написания по годам/месяцам.
Облако слов над заголовками блогов, чтобы узнать, о чем вы пишете больше всего
Тепловая карта корреляции, чтобы понять, какие факторы влияют на ваш рост/снижение. Например, мой % чтения был ниже для блогов с большой длиной блогов. Это может свидетельствовать о том, что люди не любят читать длинные тексты.
Двухвариантная кластеризация для важных факторов. Вы также можете добавить другие комбинации
Распределение различных факторов с помощью диаграмм
Анализ одного блога
В этом разделе больше внимания уделяется конкретному блогу, который включает в себя
- Облако слов на основе содержимого блога для выбранного блога
- Краткая статистика по общему количеству просмотров, прочтений, голосов и т. д.
- Ключевые слова с использованием Yake (неконтролируемая статистическая модель для извлечения ключевых слов из текста)
Сравнение блогов
Этот подраздел включает в себя сравнение двух блогов один на один на основе таких факторов, как общее количество просмотров, общее количество прочтений и т. д. Этот раздел также включает оценку сходства между двумя блогами с использованием
- Предложение BERT для создания вложений предложений
- Косинусное сходство
Многие из вас могут столкнуться с некоторыми сбоями в приложении, поскольку оно не тестировалось на многих пользователях. Пожалуйста, сообщайте о любых ошибках в этом посте или в репозитории git. В ближайшее время будут добавлены некоторые основные функции. Следите за обновлениями !!
К тому времени, прочитайте:
- Создание портфолио с помощью Streamlit
- Аналитика графов (6 частей)
- Алгоритмы НЛП (9 частей)
- Начнем с временных рядов (9 частей)
- Основы обучения с подкреплением (6 частей)
- Генеративное моделирование (7 частей)
- Трансформеры в НЛП(4 части)
- Уменьшение размеров (3 части)
- Обнаружение объектов с помощью YOLO (3 части)
- Tensorflow для начинающих (концепции + примеры) (4 части)
- Статистика для начинающих (4 части)