Свързани публикации 'data-visualization'
Data Science 101: Практическо ръководство за започване на вашата кариера през 2023 г
Въведение в науката за данните
Науката за данни е бързо развиваща се област, която съчетава различни дисциплини като компютърни науки, статистика и опит в областта, за да извлече прозрения и знания от данните. Това включва събиране, почистване, анализ и визуализация на данни, за да се отговори на сложни въпроси и да се информират бизнес решенията.
Науката за данни стана важна в различни индустрии, включително финанси, здравеопазване, търговия на дребно и технологии. Компаниите..
Как да извършите визуализация на данни за NLP проект с помощта на WordClouds
В тази поредица от 6 части ще обясня моя процес на използване на обработка на естествен език и машинно обучение за класифициране на жанровете на сценариите.
За повече информация вижте моето репо .
Част 1: Бизнес цел
Част 2: Събиране на данни
Част 3: „Разбор на данни“
Част 4: Проучвателен анализ на данни (вие сте тук)
Част 5: Изграждане на модел (все още не е публикувано)
Част 6: Внедряване на модел (все още не е публикувано)..
Овладяване на проекти за наука за данни от край до край: Най-добри практики и стратегии
Ръководство стъпка по стъпка за най-добри практики за проекти за наука за данни от край до край
Стъпка 1 — Дефинирайте проблема:
Определете ясно проблема, който се опитвате да разрешите и как изглежда успехът. Важно е да имате ясно разбиране на проблема, преди да започнете анализ.
Стъпка 2 — Събиране на данни:
Идентифицирайте източниците на данни, които ще трябва да използвате за вашия проект. Важно е да се гарантира, че данните са надеждни, точни и подходящи за проблема, който..
Как да направите сюжет на цигулка в R програмиране
Цигулковите диаграми не се виждат често при визуализация на данни, но могат да бъдат много полезни. Диаграмата на цигулката е по същество вариант на boxplot, съчетаващ boxplot и крива на плътност, за да даде картина на разпределение на данни.
В тази публикация ще обясня как могат да се правят графики на цигулка с помощта на ggplot и ще обясня къде могат да бъдат полезни в рамките на проучвателния анализ на данни.
Datapane Unleashed: Изграждане на зашеметяващи отчети с данни в Python
Datapane е библиотека на Python с отворен код, която улеснява превръщането на всеки скрипт на Python или бележник на Jupyter в интерактивно уеб приложение. С Datapane можете бързо да създавате уеб приложения, за да споделяте вашите анализи на данни и модели, без да се налага да изучавате каквато и да е уеб разработка отпред.
Някои ключови характеристики на Datapane включват:
- Автоматично генерира уеб потребителски интерфейс за Python скриптове и преносими компютри Jupyter...
Обучение на набор от данни с помощта на линейна регресия (техника на ML)
Преди няколко дни, когато провеждах курс по DS от uaceit.com , се научих да правя първия си проект за наука за данни на Jupyter Notebook, използвайки ефективен алгоритъм за машинно обучение, т.е. Линейна регресия . Научих да разбирам данните и как можем да ги свържем, за да постигнем по-добри и желани резултати. Линейната регресия може да се дефинира като „ Подход, който моделира промяна в 1 или повече предикторни променливи (да кажем x), което води до линейна промяна в променливата на..
Как работи квазиконвексността, част 5 (Машинно обучение)
На екстремните лъчи на конуса на 3×3 квазиизпъкнали квадратни форми: Екстремални детерминанти срещу екстремални и поликонвексни форми (arXiv)
Автор : Давид Арутюнян , Нарек Ховсепян
Резюме: Тази работа се занимава с изследването на екстремните лъчи на изпъкналия конус на 3×3 квазиизпъкнали квадратни форми (означени с C3). Ние характеризираме квадратични форми f∈C3, чийто детерминант на акустичния тензор е екстремален полином, и предполагаме/обсъждаме други случаи. Доказваме, че в..