Вопросы по теме 'apache-beam-io'
Чтение массовых данных из BigQuery с помощью объединений
У меня есть вариант использования, в котором мне нужно прочитать выбранные данные из BigQuery, применив левые соединения к 20 различным таблицам BQ, применить преобразования к этим данным и, наконец, выполнить дамп в окончательную таблицу BQ.
У...
166 просмотров
schedule
31.10.2023
Не удалось предоставить кодировщик для org.apache.hadoop.hbase.client.Mutation с использованием HBaseIO с FlinkRunner.
Я столкнулся с проблемой «Невозможно предоставить кодер для org.apache.hadoop.hbase.client.Mutation». используя HbaseIO с FlinkRunner. Исключение ниже:
Exception in thread "main" java.lang.IllegalStateException: Unable to return a default Coder...
411 просмотров
schedule
25.01.2024
Выполнение обработки после PDone
Есть ли способ использовать результат из приемника, т. е. PDone , для дальнейшей обработки, например отправки сообщения в Pub/Sub только после того, как данные были полностью записаны в GCS или все строки были записаны в BigQuery?
170 просмотров
schedule
06.10.2022
Истечение времени ожидания операции ReadFromDatastore при чтении более 200 000 объектов без фильтров неравенства, без передачи данных в конвейер
Я использую Google Cloud Dataflow для Python SDK для чтения более 200 000 сущностей из хранилища данных с помощью функции ReadFromDatastore() в запросе без каких-либо фильтров.
def make_example_entity_query():
"""
make an unfiltered...
134 просмотров
schedule
16.09.2022
Apache bean не может быть сериализован из-за интерфейса, который я хочу издеваться
невозможно сериализовать DoFnWithExecutionInformation{doFn=com.orderly.dataflow.RosterFileReader@60ec7684, mainOutputTag=Tag, sideInputMapping={}, schemaInformation=DoFnSchemaInformation{elementConverters=[]}} java.lang.IllegalArgumentException:...
57 просмотров
schedule
06.11.2023