Публикации по тематике big-data

Публикации по теме 'big-data'

Stanford CoreNLP в Clojure

StanfordCoreNLP является золотым стандартом в обработке языков и достаточной причиной для всех, кто серьезно занимается обработкой естественного языка, вычислительной лингвистикой или анализом текста, рассмотреть язык JVM. В этом руководстве рассказывается, как настроить и запустить минимальную функцию синтаксического анализа StanfordCoreNLP с помощью Clojure, функционального Lisp для JVM. Настраивать Поскольку StanfordCoreNLP — это не один .jar файл, а целый их набор, я рекомендую..

Как отобразить 10 М данных на веб-странице?

Ну, я имею в виду, что это вообще означает иметь десятки миллионов данных на одной диаграмме? Чтобы вам было проще понять, возьмем пример монитора Full-HD, разрешение которого 1920х1080. Общее количество пикселей составляет около 2 миллионов. Таким образом, для диаграммы с десятью миллионами элементов данных это означает, что в среднем в одном пикселе содержится около 5 элементов данных. Я поделился темой визуализации больших данных на ApacheCon North America 2019, в которой..

Введение в методы интеллектуального анализа данных и машинного обучения

1. Цель В этом блоге мы будем изучать, что такое интеллектуальный анализ данных. Кроме того, вы изучите область интеллектуального анализа данных, основу, методы интеллектуального анализа данных и терминологию в области интеллектуального анализа данных. По мере изучения этого мы изучим архитектуру интеллектуального анализа данных со схемой. Далее, будет изучать открытие знаний. Наряду с этим мы также изучим приложения для интеллектуального анализа данных, а также их плюсы и минусы...

Графики, часть 1: Как SingularityNET будет использовать OpenCog и Aigents

В этой серии исследований рассказывается, как мы будем использовать графики в качестве структур данных и сетевых диаграмм для визуализации данных. В этой серии из четырех частей мы рассмотрим различные виды графиков как структур данных и сетевых диаграмм, используемых для визуализации данных. Эти методы уже применялись в партнерских проектах SingularityNET, таких как OpenCog и Aigents . В этом посте мы дадим вводный обзор различных типов графиков , ссылаясь на примеры отрисовки..

Кластеризация данных в группы, часть 3

СТАТЬЯ Кластеризация данных в группы, часть 3 Из point 19">Data Science Bookcamp Леонарда Апельцина Эта серия статей из трех частей охватывает: Кластеризация данных по централизации Кластеризация данных по плотности Компромиссы между алгоритмами кластеризации Выполнение кластеризации с помощью библиотеки scikit-learn Перебор кластеров с помощью Pandas Получите скидку 35% на point 19">Data Science Bookcamp , введя fccapeltsin в поле кода скидки при оформлении..

Изучение визуализации данных с помощью Matplotlib и Seaborn в Python

В этой статье рассказывается об использовании двух популярных библиотек визуализации данных в Python: Matplotlib и Seaborn. Matplotlib — это библиотека для создания статических, анимированных и интерактивных визуализаций. В то же время Seaborn — это библиотека визуализации данных, построенная поверх Matplotlib и предоставляющая высокоуровневый интерфейс для создания привлекательных и информативных…

Простое объяснение нейронных сетей и обратного распространения ошибки

Любую сложную систему можно просто абстрагировать или, по крайней мере, разбить на ее базовые абстрактные компоненты. Сложность возникает из-за накопления нескольких простых слоев. Цель этого поста - объяснить, как нейронные сети работают с самой простой абстракцией. Мы попытаемся свести механизм машинного обучения в NN к его базовым абстрактным компонентам. В отличие от других статей, которые объясняют нейронные сети, мы постараемся использовать как можно меньше математических..