Публикации по теме 'big-data'


Стек технологий больших данных
Ниже описывается каждая технология на разных уровнях. Конечно, каждый слой строго не разделен в прямом смысле слова. Например, Hive предоставляет как функции обработки данных, так и функции хранения данных, но здесь он классифицируется как уровень анализа данных. 1. Уровень сбора и передачи данных Flume Flume - это распределенная, надежная и высокодоступная система для сбора, агрегирования и передачи данных. Обычно используется в системах сбора журналов, он поддерживает..

7 горячих тем, которые нужно знать на саммите DataWorks в Барселоне 2019
Вкратце о последних разработках в области больших данных, искусственного интеллекта, машинного обучения, Интернета вещей, облачных вычислений и многого другого. Путешествие к ИИ «То, что сделает искусственный интеллект таким мощным, - это его способность учиться, а способ обучения ИИ - это взгляд на человеческую культуру». - Дэн Браун Путешествие к ИИ - это то место, где сейчас находятся многие компании и организации. Большинство из них достигли стадии сбора данных - они знают,..

Случайные вопросы по науке о данных
Помните это? Это Pokedex, и если вам интересно, да, в этом путешествии будет много повторяющихся ссылок на наших Pokepals. Pokedex — это, по сути, ваш телефон, за исключением того, что его единственная возможность — гуглить покемонов. У каждого героя есть. Не покедекс, а своего рода помощник «всезнайка». Человек или устройство, которое остается рядом с вами во время путешествия и по совпадению имеет ответы на самые произвольные вопросы и решения самых трудных проблем, с которыми вы..

Что такое ОЗУ и почему это важно?
Два самых важных дня в вашей жизни — это день, когда вы родились, и день, когда вы поняли, зачем это нужно  — Марк Твен Привет всем, в этом блоге мы поговорим об одной из самых важных частей компьютера, а именно об основной памяти или временном хранилище, которое называется ОЗУ . ОЗУ означает оперативную память. Оперативная память хранится на материнской плате в модулях, которые называются DIMM. DIMM расшифровывается как Dual Inline Memory Module. DIMM — это..

Инструменты, которые должен знать каждый аналитик данных
Если вы хотите заняться аналитикой данных, как и в любой другой отрасли, есть набор инструментов, которыми вы захотите научиться пользоваться. Индустрия данных быстро меняется, и трудно успевать за новейшими инструментами, но вот некоторые инструменты и технологии, которые существуют надолго. Microsoft Excel Microsoft Excel - не самый привлекательный инструмент для использования, но это наиболее широко используемое программное обеспечение для всех, кто занимается аналитикой данных...

Ландшафт данных фрагментирован, но ваше (логическое) хранилище данных не обязательно должно быть
Текущий ландшафт данных фрагментирован не только по местоположению, но и по форме и парадигмам обработки: озера данных, архитектуры IoT, хранилища данных без SQL и графов, поставщики SaaS и т. д. обнаруживаются сосуществующими с реляционными базами данных для удовлетворения потребностей современных аналитика, ML и AI. В прошлом традиционные хранилища данных были справочным инструментом для консолидации данных в одном месте для аналитики. Но хотя они по-прежнему играют ключевую роль в..

Воскресный брифинг D4S #62
Выпуск №62 Воскресный брифинг D4S #62 Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта. 2 августа 2020 г. Дорогие друзья, Добро пожаловать на воскресный брифинг от 2 августа. Выпуск этой недели до краев наполнен захватывающим контентом. На этой неделе мы продолжаем изучение моделей эпидемий и их применения к CoVID-19. Наш последний пост из этой серии посвящен Структура сети,..