Базиран на Streamlit аналитичен инструмент за дълбоко гмуркане в анализите на вашия среден профил

Пиша в Medium от около 3 години с около 80 блога за AI & Data Science. Тъй като Medium не плаща на индийски писатели, никога не съм смятал Medium Premium за тежко изискване. Все пак винаги съм искал да имам инструмент, който може да ми помогне да се потопя в публикациите си по-дълбоко от това, което Medium предоставя в безплатния си абонамент.

Какво следва?

Използвайки Streamlit, наскоро се опитах да проектирам такъв аналитичен инструмент, който може да помогне на технически и нетехнологични момчета да имат междинни статистики заедно с някои изводи, които да направят.

Streamlit WebApp: https://mehulgupta2016154-medium-profile-analyzer-about-4kgv5r.streamlitapp.com/

Поддържайки нещата прости за сега, приложението е разделено на 2 части

  • Цялостен анализ
  • Анализ на единичен блог

Цялостен анализ

Целта на този раздел е да предостави обобщени показатели. По-долу са въведените за момента секции

Хронология на блогове

Като се има предвид годината на издаване, тази функция показва времева линия за всички блогове, публикувани през тази година, със снимки на корицата и URL адрес

Топ блогове

Като се има предвид критерий (изглед, четения, дължина на четене и т.н.), кой блог има най-висока стойност

Блог %

Този раздел има за цел да разбере кои и от блоговете отговарят на дадено условие (като 1k+ гледания, 1k+ четения, 10+ гласувания за и т.н.)

Честота на блоговелинии за анализиране на темпото ви на писане през години/месеци

Облак от думинад заглавията на блогове само за да разберете за какво пишете най-много

Корелационна топлинна картаза да разберете кои фактори влияят на вашия растеж/спад. Например My read % беше по-нисък за блогове, където дължината на блоговете беше висока. Може да е показателно, че хората не предпочитат да четат дълги текстове

Двувариантно клъстериранеза важни фактори. Можете да добавите и други комбинации

Разпределение на различни фактори с помощта на графики

Анализ на единичен блог

Този раздел се фокусира повече върху конкретен блог, който включва

  • Word-cloud, базиран на блог съдържание за избрания блог

  • Кратка статистика за общия брой гледания, четения, гласувания за и т.н
  • Ключови думи, използващи Yake (неконтролиран статистически модел за извличане на ключови думи от текст)

Сравнение на блогове

Този подраздел включва сравнение един към един между 2 блога въз основа на фактори като общ брой показвания, общ брой четения и т.н. Този раздел също включва оценка за сходство между двата блога, използвайки

  • Изречение BERT за генериране на вграждане на изречения
  • Косинусово подобие

Много от вас може да се сблъскат с някои проблеми в приложението, тъй като не е тествано на много потребители. Моля, докладвайте за всяка грешка в тази публикация или в git repo. Ще добави някои основни функции в близкото време. Останете на линия!!

Дотогава прочетете: