Свързани въпроси 'google-cloud-dataproc'

Приложенията на YARN не могат да стартират, когато се посочват етикети на възли на YARN
Опитвам се да използвам YARN етикети на възли за маркиране на работни възли, но когато стартирам приложения на YARN (Spark или обикновено приложение YARN), тези приложения не могат да стартират. със Spark, когато се посочи --conf...
1926 изгледи

Грешка при зареждане на данни от таблицата на BigQuery в клъстер Dataproc
Нов съм в Dataproc и PySpark и се сблъсквам с определени проблеми, докато интегрирам таблицата на BigQuery към клъстера на Dataproc чрез API на Jupyter Lab. По-долу е кодът, който използвах за зареждане на таблицата BigQuery в клъстера Dataproc чрез...
180 изгледи

Има ли по-добър начин за зареждане на spark df в BigQuery чрез клъстер PySpark (dataporc)?
В момента използвам кода по-долу, за да заредя данни в BigQuery чрез клъстер на PySpark (dataproc), но или обработката отнема твърде много време, или се прекратява с грешка при превишено време за изпълнение. Има ли по-добър и по-бърз начин за...
93 изгледи

Hadoop екземпляри на GCE
Настройвам клъстер Hadoop на Google Compute Engine. Но имам проблеми с разбирането как ще работи екземплярът на клъстера. Вече търсих много, но нищо не даде ясен отговор. Когато настройвате Hadoop клъстер, създавате ли изображение на един...
254 изгледи