Свързани въпроси 'apache-beam'
Проблеми с кодера с Apache Beam и CombineFn
Ние изграждаме тръбопровод, използвайки Apache Beam и DirectRunner като бегач. В момента се опитваме да създадем прост тръбопровод, чрез който:
Изтеглете данни от Google Cloud Pub/Sub (в момента използвате емулатора за локално изпълнение)...
4853 изгледи
schedule
17.09.2022
Времето за изчакване на операцията ReadFromDatastore при четене на 200k+ обекта без филтри за неравенство, без данни, които го превръщат в конвейер
Използвам Google Cloud Dataflow за Python SDK, за да чета в 200k+ обекта от хранилище за данни, като използвам функцията ReadFromDatastore() на заявка без никакви филтри.
def make_example_entity_query():
"""
make an unfiltered query on...
134 изгледи
schedule
16.09.2022
Неуспешно създаване на проект в приставката за Eclipse Google Cloud Tools за Eclipse
Някой се е сблъсквал с тази грешка в приставката на Eclipse „Проектът не е активиран за Cloud Dataflow“. Опитвам се да създам нов проект за поток от данни, предоставящ „Акаунт“ и „Идентификационен номер на проект за платформа за облаци“ и той се...
92 изгледи
schedule
19.09.2022
Можем ли да пишем avro файлове в динамично създадени GCS кофи (базирани на tenantID)?
По принцип това, което се опитвам да направя, е да създам GCS кофа въз основа на tenantID (идва като част от събитието) и да запиша тези събития с помощта на FileIO.writeDynamic, използвайки динамично именуване на файлове в задание на google dataflow....
122 изгледи
schedule
17.09.2022
Apache beam : Програмно създаване на разделени таблици
Пиша облачен поток от данни, който чете съобщения от Pubsub и ги съхранява в BigQuery. Искам да използвам разделена таблица (по дата) и използвам Timestamp , свързан със съобщението, за да определя в кой дял трябва да влезе съобщението. По-долу е...
919 изгледи
schedule
26.09.2022
Мога ли да предам странични входове към Apache Beam PTransforms?
Обработвам предварително данни за TensorFlow с помощта на Apache Beam. Бих искал да избера броя на сегментите TFRecord въз основа на броя примери в моя набор от данни. Съответният раздел от кода е:
EXAMPLES_PER_SHARD = 5.0
num_tfexamples =...
720 изгледи
schedule
28.09.2022
Как Scio се връща към Kryo
Виждам, че Scio се връща към Kryo кодер, а не Java Serializer, който е кодер по подразбиране, използван за Dataflow, когато кодерът не може да бъде изведен/намерен чрез CoderRegistry. Не виждам никъде препратка към setFallbackCoderProvider , как...
114 изгледи
schedule
03.10.2022