Публикации по теме 'analytics'


Вероятность и статистика для науки о данных Часть-1
Вероятность и статистика составляют основу науки о данных. Теория вероятностей очень помогает делать прогнозы. Оценки и прогнозы составляют важную часть науки о данных. С помощью статистических методов делаем оценки для дальнейшего анализа. Таким образом, статистические методы во многом зависят от теории вероятностей. И вся вероятность и статистика зависят от Данных. Данные Данные - это собранная у нас информация (наблюдения) о чем-либо или факты и статистика, собранные вместе для..

Неорганизованные ноутбуки Jupyter убивают вас: 3 способа навести порядок
Краткий обзор конвейеров Kedro, машинного обучения Azure и Scikit-Learn. Не поймите меня неправильно; Блокноты Jupyter (и, соответственно, блокноты Databricks) отлично подходят для выполнения начального исследовательского анализа данных, изучения производительности модели и тестирования начальных заданий ETL. Однако использование исключительно ноутбуков для обучения и развертывания моделей машинного обучения ограничивает воспроизводимость и стандартизацию. Трудно взять чужой блокнот..

Платформа обработки данных на основе искусственного интеллекта для решения даже самых сложных задач
Когда в конце этой недели в Javits Center в Нью-Йорке откроется конференция O’Reilly Strata Data Conference, некоторых поставщиков программного обеспечения, которые помогли открыть эру больших данных, там не будет. Возьмите Alpine Data Labs , ClearStory Data , Hortonworks , MapR , Platfora и другие, все они были приобретены более крупными вендорами. Но есть одна процветающая платформа для науки и аналитики данных, происхождение которой сильно отличается от этих — OpenText..

Новости науки о данных: 10–03–2019
Последние статьи в области науки о данных - алгоритмически отобранные, ранжированные и обобщенные специально для вас. News Flash - это еженедельное издание, в котором публикуются основные новости по определенной теме. Истории алгоритмически подбираются, оцениваются по качеству и ранжируются, чтобы вы могли оставаться в курсе самых важных событий. Кроме того, наиболее важные предложения для каждой истории извлекаются и отображаются в виде основных моментов, чтобы вы могли понять, о чем..

Мое путешествие от физики к науке о данных
Я по-прежнему изучаю новые знания каждый день с моей растущей страстью в области Data Science. Чтобы продолжить карьеру выпускника-физика, необходимо ответить на вопросы «Почему» и «Как» . Меня спрашивали о моем переходе от академической науки - физики к науке о данных, и я надеюсь, что моя история ответит на вопросы о том, почему я решил стать специалистом по данным и как я добился этого. цель , и, в конечном итоге, поощрять, а также вдохновлять больше людей на то, чтобы..

Что такое Байесовский сетевой классификатор?
Классификатор, который предполагает сильные (наивные) предположения о независимости, основанные на теореме Байеса, известен как байесовский сетевой классификатор. Более описательным термином для лежащей в основе вероятностной модели будет «независимая модель признаков». Проще говоря, наивный байесовский классификатор предполагает, что наличие (или отсутствие) определенного признака класса не связано с наличием (или отсутствием) какого-либо другого признака. Пример: В любом банке для..

Методы перекрестной проверки и их приложения
Введение Прежде чем углубляться в детали методов перекрестной проверки и их применения, мы рассмотрим этапы конвейера машинного обучения. Это поможет нам лучше визуализировать цель перекрестной проверки. Чтобы понять перекрестную проверку , нам нужно знать пару вещей, связанных с созданием модели. Предположим, у нас есть набор данных с 10 тыс. записей. Основываясь на приведенном выше алгоритме, мы должны выполнить Train Test Split. Набор для обучения и проверки будет..