Вопросы по теме 'apache-beam-io'

Чтение массовых данных из BigQuery с помощью объединений
У меня есть вариант использования, в котором мне нужно прочитать выбранные данные из BigQuery, применив левые соединения к 20 различным таблицам BQ, применить преобразования к этим данным и, наконец, выполнить дамп в окончательную таблицу BQ. У...
166 просмотров

Не удалось предоставить кодировщик для org.apache.hadoop.hbase.client.Mutation с использованием HBaseIO с FlinkRunner.
Я столкнулся с проблемой «Невозможно предоставить кодер для org.apache.hadoop.hbase.client.Mutation». используя HbaseIO с FlinkRunner. Исключение ниже: Exception in thread "main" java.lang.IllegalStateException: Unable to return a default Coder...
411 просмотров
schedule 25.01.2024

Выполнение обработки после PDone
Есть ли способ использовать результат из приемника, т. е. PDone , для дальнейшей обработки, например отправки сообщения в Pub/Sub только после того, как данные были полностью записаны в GCS или все строки были записаны в BigQuery?
170 просмотров

Истечение времени ожидания операции ReadFromDatastore при чтении более 200 000 объектов без фильтров неравенства, без передачи данных в конвейер
Я использую Google Cloud Dataflow для Python SDK для чтения более 200 000 сущностей из хранилища данных с помощью функции ReadFromDatastore() в запросе без каких-либо фильтров. def make_example_entity_query(): """ make an unfiltered...
134 просмотров

Apache bean не может быть сериализован из-за интерфейса, который я хочу издеваться
невозможно сериализовать DoFnWithExecutionInformation{doFn=com.orderly.dataflow.RosterFileReader@60ec7684, mainOutputTag=Tag, sideInputMapping={}, schemaInformation=DoFnSchemaInformation{elementConverters=[]}} java.lang.IllegalArgumentException:...
57 просмотров
schedule 06.11.2023