Медленный ответ BigQuery

У меня есть относительно небольшой набор данных, в котором я пишу аналитику журнала IP, а затем выполняю запросы к нему.

Я обновляю BigQuery один раз в час с обновленной статистикой.

У меня 110 000 строк с 37 МБ данных.

Следующий запрос занимает от 7 секунд до 50+ секунд для выполнения:

ВЫБЕРИТЕ СУММУ (1) как представления ОТ [statistics.statsLogNSI], ГДЕ lastedit > DATE_ADD (CURRENT_TIMESTAMP (), -7, «ДЕНЬ»)

Мои более сложные примеры запросов приведены ниже:

ВЫБЕРИТЕ СУММУ (1) как просмотры ИЗ [statistics.statsLogNSI], ГДЕ НЕ комбинация содержит «isRobot: True» И ownerKey = «14013» И страна = «США» И lastedit> DATE_ADD (CURRENT_TIMESTAMP (), -7, «ДЕНЬ»)

Есть ли у вас рекомендации по оптимизации этого набора результатов? Я видел предыдущий пост о «фрагментации» в BigQuery. Обновление таблицы один раз в час слишком часто?


person Nick Caruso    schedule 05.08.2014    source источник
comment
Этот запрос не должен выполняться так долго. Можете ли вы указать идентификатор задания из запроса, который выполнялся особенно медленно? (если вы используете веб-интерфейс, вы можете перейти на панель истории запросов и найти идентификаторы прошлых заданий).   -  person Jordan Tigani    schedule 05.08.2014
comment
Спасибо за быстрый ответ. Вот идентификатор работы. Сегодня это быстрее, чем когда я писал, но это все равно заняло 15 секунд: корпоративные видео: job_Pics6cxc_w9_shJKwKxz8WuGfho   -  person Nick Caruso    schedule 06.08.2014
comment
Это заняло всего 160+ секунд: корпоративные видео: job_8GR3Pb2ueQUUkjsJn5feFvMmAcA   -  person Nick Caruso    schedule 06.08.2014