Публикации по тематике big-data

Публикации по теме 'big-data'

Платформа обработки данных на основе искусственного интеллекта для решения даже самых сложных задач

Когда в конце этой недели в Javits Center в Нью-Йорке откроется конференция O’Reilly Strata Data Conference, некоторых поставщиков программного обеспечения, которые помогли открыть эру больших данных, там не будет. Возьмите Alpine Data Labs , ClearStory Data , Hortonworks , MapR , Platfora и другие, все они были приобретены более крупными вендорами. Но есть одна процветающая платформа для науки и аналитики данных, происхождение которой сильно отличается от этих — OpenText..

Для меня это все Вода (или лучше сказать H2O)!

Кришна Вишванатан — первоначально опубликовано как мой гостевой пост в блоге H2O.ai 24 декабря. В карьере любого венчурного капиталиста каждый боится «момент охренеть». Для тех, кто не знаком с этим наиболее техническим термином, — это момент ясности, когда венчурный капиталист сразу после закрытия последняя инвестиция (часто на первом послеинвестиционном собрании Совета) возвращается на землю с осознанием того, что новая блестящая инвестиция в конце концов не была такой уж..

Что такое Байесовский сетевой классификатор?

Классификатор, который предполагает сильные (наивные) предположения о независимости, основанные на теореме Байеса, известен как байесовский сетевой классификатор. Более описательным термином для лежащей в основе вероятностной модели будет «независимая модель признаков». Проще говоря, наивный байесовский классификатор предполагает, что наличие (или отсутствие) определенного признака класса не связано с наличием (или отсутствием) какого-либо другого признака. Пример: В любом банке для..

Почему функция каталога Apache SeaTunnel значительно упрощает процесс активации пользователя?

Каталоги предоставляют метаданные, такие как базы данных, таблицы и информацию, необходимую для доступа к данным в базах данных или других механизмах хранения. Каталоги предоставляют единый API для управления метаданными, проверки подключения и обеспечения доступа к метаданным для источников, приемников и Интернета. Каталог позволяет пользователям ссылаться на существующие метаданные в своих системах данных и автоматически сопоставляет их с соответствующими метаданными SeaTunnel...

Что такое Apache Spark?

Apache Spark — это унифицированный вычислительный движок и набор библиотек для параллельной обработки данных на компьютерных кластерах. На данный момент Spark является самой гиперактивной машиной с открытым исходным кодом для этой работы, что делает его обычным инструментом для любого программиста или мастера данных, интересующегося большими данными. Spark поддерживает несколько популярных языков программирования (Python, Java, Scala и R), включает в себя книжные полки для различных..

Восприятие данных в современном мире

Человеческий прогресс следует закону, который футуристы называют законом ускорения отдачи . Он гласит, что хотя прогресс, которого достигают люди, со временем увеличивается, скорость, с которой люди прогрессируют во времени, также увеличивается. Проще говоря, если бы кто-то количественно оценил человеческий прогресс и построил его график с течением времени, этот график был бы в некоторой степени похож на график экспоненциальной функции. Это означает, что впереди нас ждет много..

О мудрости толпы: коллективная прогнозная аналитика

«Всякая великая ложь имеет зерно истины» (Джеймс Коттрелл, личное сообщение, 2004 г.). В 1907 году сэр Фрэнсис Гальтон (1855–1911) - британский статистик, чьи исследования были сосредоточены на человеческом интеллекте и который также был двоюродным братом Чарльза Дарвина, - заметил это на фестивальном конкурсе в Корнуолле, где люди пытались угадать вес быка, среднее значение всех предположений неизменно близко к фактическому весу быка (Galton, 1907; Ball, 2014; Gega, 2000). Автор Джеймс..