Публикации по теме 'big-data'


Как последовательно подключить Macbook Pro для машинного обучения.
Интересно, что Apple попрощалась с 15-дюймовым Macbook Pro и представила 14-дюймовый Macbook Pro и 16-дюймовый Macbook Pro на сегодняшнем мероприятии, посвященном аппаратному обеспечению в октябре. Сенсорная панель исчезла, добавив функциональные клавиши вместо сенсорной панели. Более интересное событие добавляет порт HDMI вместо портов Thunderbolt, включая SD-карту, возвращающую ретро-обновления. У меня были порты HDMI, порт зарядки Magsafe, порты USB и порт Thunderbolt на старых машинах...

Варианты использования Apache Spark
Конечно, Apache Spark выглядит круто, но оправдывает ли он шумиху? Есть ли что-нибудь, что вы можете сделать с этим на самом деле? На самом деле, сейчас есть несколько довольно крутых вариантов использования. Исследовательская аналитика Одной из лучших особенностей современных языков программирования является то, что многие из них предлагают интерактивные оболочки, от Bash до Python и Scala. Вместо трудоемкого цикла написания/компиляции/тестирования/отладки вы можете сразу..


Прогнозирование стоимости дома с помощью регрессионного анализа
Модель машинного обучения ВСТУПЛЕНИЕ Регрессионный анализ - это основной метод статистического анализа данных. Это статистический метод, который позволяет оценить взаимосвязь между переменными. Необходимо определить зависимую переменную, которая будет варьироваться в зависимости от значения независимой переменной. Например, стоимость дома (зависимая переменная) варьируется в зависимости от квадратных футов дома (независимая переменная). Регрессионный анализ - очень полезный..

Платформы; ДБТ; Apache Iceberg в двух предложениях; ThDPTh #47
Я только что прочитал простейшее объяснение формата таблицы, такого как Apache Iceberg. Иди тоже читай! См. ниже… Я Свен , я собираю Точки данных , чтобы помочь понять и сформировать будущее, основанное на данных. Мысли Свенса Если у вас есть всего 30 секунд свободного времени, вот что я считаю полезной информацией для инвесторов, руководителей данных и основателей компаний, занимающихся данными.

Аналитика и технологии больших данных в условиях COVID-19
пример использования больших данных Потребность в решениях для больших данных Введение в большие данные в сфере здравоохранения В последние годы использование технологии больших данных использовалось для решения проблемы роста данных в нескольких промышленных секторах. Согласно Ambigavathi and Sridharan (2018), большие данные — это большие объемы данных, которые можно быстро генерировать, собирать и обрабатывать с высокой скоростью, и которые нельзя классифицировать как обычную..

Общий обзор Apache Spark
Что такое Spark? Давайте заглянем под капот В моем последнем посте мы представили проблему: обильные, нескончаемые потоки данных, и ее решение: Apache Spark . Во второй части мы сосредоточимся на внутренней архитектуре Spark и структурах данных. В первые дни они использовали волов для тяжелой тяги, и когда один вол не мог сдвинуть с места бревно, они не пытались вырастить более крупного быка. Мы должны стремиться не к большим компьютерам, а к большему количеству компьютерных..