У меня есть относительно небольшой набор данных, в котором я пишу аналитику журнала IP, а затем выполняю запросы к нему.
Я обновляю BigQuery один раз в час с обновленной статистикой.
У меня 110 000 строк с 37 МБ данных.
Следующий запрос занимает от 7 секунд до 50+ секунд для выполнения:
ВЫБЕРИТЕ СУММУ (1) как представления ОТ [statistics.statsLogNSI], ГДЕ lastedit > DATE_ADD (CURRENT_TIMESTAMP (), -7, «ДЕНЬ»)
Мои более сложные примеры запросов приведены ниже:
ВЫБЕРИТЕ СУММУ (1) как просмотры ИЗ [statistics.statsLogNSI], ГДЕ НЕ комбинация содержит «isRobot: True» И ownerKey = «14013» И страна = «США» И lastedit> DATE_ADD (CURRENT_TIMESTAMP (), -7, «ДЕНЬ»)
Есть ли у вас рекомендации по оптимизации этого набора результатов? Я видел предыдущий пост о «фрагментации» в BigQuery. Обновление таблицы один раз в час слишком часто?