Публикации по тематике big-data

Публикации по теме 'big-data'

Обработка больших (-иш) данных в Postgres с помощью секционирования данных

TL;DR Чтобы справиться с таблицей, которая, по прогнозам, будет содержать много данных, мы можем использовать функцию секционирования данных Postgres. Эта функция позволяет нам разделить таблицу на более мелкие таблицы, которые будут содержать часть данных на основе правила, например. первая буква имени клиента или месяц даты создания. Таким образом, мы можем запросить родительскую таблицу, используя правило: SELECT * FROM родительская_таблица ГДЕ применяется правило,..

Наука о данных и машинное обучение с помощью Scala и Spark (серия 02/03)

ОБУЧЕНИЕ МАШИНАМ SCALA SPARK Наука о данных и машинное обучение с помощью Scala и Spark (серия 02/03) Spark с API Scala Изобретатели Spark выбрали Scala для написания низкоуровневых модулей. В Науке о данных и машинном обучении с помощью Scala и Spark (Эпизод 01/03) мы рассмотрели основы языка программирования Scala при использовании среды Google Colab. В этой статье мы узнаем об экосистеме Spark и ее высокоуровневом API для пользователей Scala. Как и раньше, мы по-прежнему..

Ты это знал

Технология была «на удивление очаровательной и похожей на человека», и она вот-вот выйдет в реальный мир. Обсуждался вопрос о том, должно ли правительство субсидировать дошкольные учреждения. Но настоящий вопрос заключался в том, сможет ли машина под названием IBM Debater переспорить высокопоставленного участника дебатов. Ответ, как оказалось, был отрицательным. Зарегистрируйтесь сейчас — https://www.aiforindia.ai/Register #registernow #futuretumharahai #reskilltoupskill..

Основные понятия и термины, которые необходимо знать об искусственном интеллекте и машинном обучении

С различными терминами и модными словечками, вот подробный глоссарий с примерами. Когда дело доходит до искусственного интеллекта (ИИ) и машинного обучения (МО), существует множество различных терминов и модных словечек. Может быть трудно уследить за тем, что все означает, особенно когда некоторые термины кажутся взаимозаменяемыми. Однако важно иметь хотя бы базовое представление о словаре терминов ИИ и машинного обучения. Это связано с тем, что эти технологии становятся все более..

Создание платформы автоматизации управления претензиями

Помогаем страховщикам создавать инфраструктуру с поддержкой ИИ для автоматизации требований От подачи претензии до скорости урегулирования и прозрачности — процесс подачи претензии является ключевым фактором удовлетворенности клиентов в страховом секторе. Машинное обучение помогает улучшить процесс рассмотрения претензий, выявляя и исправляя ошибки, избегая при этом неэффективных вмешательств. Его также можно использовать для обнаружения мошенничества, устранения сложных правил..

Данные о мобильности, разработка функций и иерархическая кластеризация

Соединенные Штаты имеют один из крупнейших автомобильных рынков мира, уступающий только Китаю. По состоянию на 2017 год на дорогах Америки было зарегистрировано 270,4 миллиона автомобилей, и каждый год происходят миллионы аварий. По данным Национальной службы безопасности дорожного движения, в 2016 году в США было зарегистрировано около 7 миллионов дорожно-транспортных происшествий, о которых полиция сообщила. Это привело к убыткам в результате столкновений в 2016 году на сумму около..

Hadoop и Spark: в чем разница?

Большие данные — это термин, используемый для описания чрезвычайно больших наборов данных, которые слишком сложны для обработки с использованием традиционных методов обработки данных. Для работы с такими большими наборами данных появился новый класс сред распределенных вычислений, две из которых наиболее популярны — Apache Hadoop и Apache Spark. Хотя и Hadoop, и Spark предназначены для обработки больших наборов данных в распределенной вычислительной среде, они имеют некоторые..