Да речем в програмата Dataflow/Apache Beam, опитвам се да прочета таблица, която има данни, които нарастват експоненциално. Искам да подобря ефективността на четенето.
BigQueryIO.Read.from("projectid:dataset.tablename")
or
BigQueryIO.Read.fromQuery("SELECT A, B FROM [projectid:dataset.tablename]")
Ще се подобри ли ефективността на моето четене, ако избирам само необходимите колони в таблицата, а не цялата таблица по-горе?
Наясно съм, че избирането на няколко колони води до намалени разходи. Но бих искал да знам ефективността на четене по-горе.