Apache Kylin без Hadoop / Hive

Я использую Snowflake в качестве DWH и Spark для своего ETL, и у меня нет таблиц Hive.
Есть ли возможность использовать Apache Kylin без экосистемы Hadoop?

raul7 11.11.2019 источник

comment

AFAIK Kylin сильно зависит от HBase. См. Требования к программному обеспечению @ kylin.apache.org/docs/install/index.html - mazaneicha 11.11.2019

comment

Отличный вопрос. Их продавцы говорят да, килигенс. io / blog / - KCD 29.01.2021

Ответы (3)

arrow_upward
0
arrow_downward

Это довольно сложно из того, что я прочитал. Некоторые альтернативы, которые я бы предложил, чтобы воспользоваться преимуществами аналитики в распределенных системах, - это использование материализованных представлений для фильтрации данных, которые вы хотите получить от частей каждой распределенной системы в Snowflake Подробнее о материализованных представлениях

https://docs.snowflake.net/manuals/user-guide/views-materialized.html

А функция предварительного просмотра, обмен данными для анализа запросов?

https://docs.snowflake.net/manuals/user-guide/data-exchange-intro.html

Надеюсь, это поможет, извините, я не очень помог с Apache Kylin.

Rachel McGuigan 12.11.2019

arrow_upward
0
arrow_downward

Kyligence Cloud, основанное на ядре Apache Kylin, но облачное предложение, построенное на AWS и Azure, предоставляет возможность подключаться к Snowflake напрямую без Hadoop. Подробнее читайте здесь: https://kyligence.io/news/kyligence-releases-cloud-native-olap-for-azure-aws-and-google-cloud-platform/

Billy Liu 12.11.2019

comment

Вы правы, у них есть последняя версия, но я не уверен, насколько она надежна. Спасибо - raul7; 15.11.2019

arrow_upward
-1
arrow_downward

Ответ - нет. Он не может читать напрямую из кадров Spark Data, источники данных, которые он поддерживает, - это Hive, Kafka и RDBMS.

raul7 12.11.2019

comment

В любом случае фреймы данных нигде не хранятся, это только формат времени выполнения. - OneCricketeer; 14.11.2019

comment

Я не голосовал против, и нет возможности узнать, кто голосовал. Тот факт, что вы прямо сказали чтение, не означает, что вы где-то сохранили фреймворк. Spark может писать в Hbase, а не только в те места, которые вы указали. - OneCricketeer; 15.11.2019

comment

Тогда я прошу прощения за то, что обвиняю вас. Как вы упомянули, Spark может писать в HBase, но это не то, что мне нужно. Я хочу, чтобы это было не только в HBase, а как вход для Kylin, который сам создает свой куб OLAP, сохраняя его в своем хранилище (в настоящее время только HBase). - raul7; 15.11.2019

Apache Kylin без Hadoop / Hive

Ответы (3)

Похожие вопросы