Публикации по темата analytics

Свързани публикации 'analytics'

Вероятност и статистика за науката за данни, част-1

Вероятността и статистиката формират основата на Data Science. Теорията на вероятностите е много полезна за правене на прогнози. Оценките и прогнозите са важна част от науката за данните. С помощта на статистически методи правим оценки за по-нататъшен анализ. По този начин статистическите методи до голяма степен зависят от теорията на вероятностите. И всички вероятности и статистики зависят от данните. Данни Данните са събраната информация (наблюдения), която имаме за нещо или факти..

Неорганизираните тетрадки Jupyter ви убиват: 3 начина да се организирате

Кратък преглед на тръбопроводите Kedro, Azure Machine Learning и Scikit-Learn Не ме разбирайте погрешно; Jupyter Notebooks (и като разширение Databricks Notebooks) са страхотни за извършване на първоначален проучвателен анализ на данни, изследване на производителността на модела и тестване на първоначални ETL задачи. Въпреки това, разчитането само на преносими компютри за обучение и внедряване на модели за машинно обучение ограничава възпроизводимостта и стандартизацията. Трудно е да..

Научна платформа за данни, управлявана от изкуствен интелект дори за най-трудните ви проблеми

Когато O’Reilly's Strata Data Conference се отвори в Javits Center в Ню Йорк по-късно тази седмица, някои от доставчиците на софтуер, които помогнаха за началото на ерата на големите данни, няма да присъстват. Вземете Alpine Data Labs , ClearStory Data , Hortonworks , MapR , Platfora и други, всички от които са придобити от по-големи доставчици. Но има една процъфтяваща платформа за наука и анализ на данни, чийто произход изглежда много по-различен от тези — „OpenText Magellan“ е..

Флаш новини за науката за данни: 10–03–2019 г

Най-новите статии за Data Science — алгоритмично подбрани, класирани и обобщени специално за вас. News Flash е седмична публикация, която включва най-важните новини за конкретна тема. Историите са подготвени алгоритмично, оценени за качество и класирани, така че да можете да сте на върха на най-важните развития. Освен това, най-важните изречения за всяка история се извличат и показват като акценти, така че да можете да добиете представа за какво е всяка история. Ако искате повече..

Моето пътуване от физиката към науката за данните

Все още научавам нови знания всеки ден с нарастващата ми страст в областта на Data Science. За да преследвате различна кариера като завършващ студент по физика, трябва да има въпроси „Защо“ и „Как“ , на които трябва да се отговори. След като бях попитан от редица хора за прехода ми от академичните среди — Физика към Data Science, се надявам, че моята история може да отговори на въпросите защо реших да стана Data Scientist и как продължих целта и в крайна сметка насърчаване, както..

Какво е Bayesian Network Classifier?

Класификатор, който приема силни (наивни) допускания за независимост, базирани на теоремата на Байс, е известен като класификатор на байесова мрежа. По-описателен термин за основния вероятностен модел би бил „модел на независими характеристики“. С прости думи, наивният класификатор на Бейс предполага, че присъствието (или отсъствието) на конкретна характеристика на даден клас не е свързано с присъствието (или отсъствието) на която и да е друга характеристика. Пример: Във всяка банка за..

Техники за кръстосано валидиране и техните приложения

Въведение Преди да навлезем в детайлите на техниките за кръстосано валидиране и тяхното приложение, ще видим какви са стъпките в тръбопровода за машинно обучение. Това ще ни помогне да визуализираме по-добре целта на извършването на кръстосано валидиране. За да разберем кръстосаното валидиране, трябва да знаем няколко неща, които са включени в създаването на модел. Да предположим, че имаме набор от данни с 10k записа. Въз основа на горния поток ще извършим разделяне на тест за..