Публикации по теме 'big-data'


Извлечение полезной информации из данных: руководство по анализу и использованию данных для бизнеса…
И. Введение В сегодняшнюю цифровую эпоху данные повсюду. Каждый раз, когда мы используем наши телефоны, просматриваем Интернет или даже проходим мимо датчика, мы генерируем данные. Но что такое данные? Проще говоря, данные — это любая информация, которую можно собрать и проанализировать. Он может быть в различных формах, таких как числа, текст, изображения, видео и многое другое. Данные становятся все более важными для предприятий любого размера. Анализируя данные, компании могут..

Копирование данных Hadoop - Hive в сегмент S3
ЧТО ТАКОЕ S3: S3 означает «Простая служба хранения» и предлагается Amazon Web Services. Он обеспечивает простое в использовании хранилище файловых объектов через веб-службу. AWS предоставляет веб-интерфейс для S3, а также AWS CLI (интерфейс командной строки). ПОЧЕМУ S3: многие организации перемещают данные в облако, потому что это более доступный вариант, чем их локальное хранение. Некоторые организации используют S3 из Amazon Web Services (AWS), чтобы они могли легко..

Простое руководство по моделированию данных Covid-19 в Python
Произведите впечатление на всех своих друзей и будьте притчей во языцех с лучшей моделью Covid-19 10 минут работы на Python принесут вам Хотите произвести впечатление на парней в пабе? Устали знать все это Норман и его степень из Университета жизни? Пройдите этот ускоренный курс Python по моделированию covid-19 и будьте в центре внимания участников вечеринки, когда вы засовываете им в лицо свои причудливые графики и нестандартное кодирование. Еще лучше пропустите статью, загрузите..

Наборы данных, золото машинного обучения
В этой статье я собираюсь изучить машинное обучение, но если вы новичок в этом, я рекомендую вам взглянуть на статью @ ageitgey Машинное обучение - это весело! В эпоху подключений данные, которые мы можем собирать от пользователей, - это золото Интернета. Компании и рекламодатели обмениваются частями нашей жизни в виде файлов cookie, предпочтений, привычек просмотра и журналов. После появления таких модных словечек, как Big Data, Data Mining, Data Analytic в последние несколько..

Как издатели принимают ИИ? AI за письменное слово.
Издательство - это уже не просто книга. Речь идет об исполнении этой книги на нескольких носителях и о принятии этой книги массами. Следовательно, публикация зависит не только от себя, но и от других средств массовой информации. Бестселлер попадает в сериал Netflix или в фильм, что, в свою очередь, дает дополнительный импульс продажам книг. Итак, контент в его традиционной форме, то есть как книга, никогда не умирает. На самом деле, потребность в хорошем контенте велика как никогда,..

Интервью с командой Tencent по технологиям больших данных: Tencent запустила вычислительную платформу с открытым исходным кодом…
Вступление: По мере дальнейшего развития технологий глубокого обучения в последние годы многие платформы машинного обучения стали открытыми, а не специализированными. Теперь, если у технологической компании нет ведущей платформы машинного обучения, для компании будет неловко. Например, у Google есть TensorFlow, у Microsoft - CNTK, Facebook - сильная сторонница Torch, IBM поддерживает Spark сзади, Baidu недавно выпустила PaddlePaddle с открытым исходным кодом, а Amazon анонсировала свою..

Обеспечение качества больших данных
Вступление Эта статья представляет собой отрывок из моей статьи Рецепт конвейера больших данных . В этом коротком посте я попытаюсь обобщить инструменты качества данных, доступные для вашего конвейера данных. Будете ли вы отправлять код в производство без тестов или проверки кода? Итак, почему компании создают конвейеры, не тестируя свои информационные ресурсы? Качество данных Один из важных аспектов больших данных, который часто игнорируется, - это качество и надежность..