Как оптимизировать создание таблицы в Netezza?

Я создаю таблицу с агрегатными функциями для нескольких столбцов, и у меня нет соединений. он имеет более 7 миллионов строк и распределяется случайным образом. это занимает почти 4-5 часов.

может ли кто-нибудь помочь, как оптимизировать или лучше всего создавать эти таблицы в netezza. к сожалению, у нас нет подсказок для использования.

Заранее спасибо.


person Dileep    schedule 13.03.2014    source источник
comment
Есть ли какая-то конкретная причина для выбора случайного распределения? Если вы используете CTAS без распределения, по умолчанию будет использоваться то же распределение, что и для исходной таблицы, что может быть более эффективным. Не могли бы вы предоставить запрос, который вы выполняете, и распределение/организацию исходной таблицы? Здесь может сыграть роль множество факторов.   -  person qSlug    schedule 29.05.2014


Ответы (2)


попробуйте создать таблицу table_name ( field1 bigint, field2 varchar (10)) распределите случайным образом

вставить в table_name ()

генерировать статистику по table_name

ключ контролирует ваши типы данных. если ваш набор записей состоит из больших полей varchar, netezza будет бороться за скорость. если вы можете взять свои числовые поля и преобразовать их в целые типы, вы увидите лучшую производительность. Все ваши поля varchar должны быть «разумными» (не используйте varchar(5000) в каждом поле.

другой вариант:

возможно таблица статистики не обновляется.

генерировать экспресс-статистику по table_name;

последний вариант:

какой ключ дистрибуции на существующей таблице? Возможно, это является причиной вашей проблемы, поскольку таблица имеет большой перекос, что означает, что вы не распределяете по ящику эффективно. Если вы являетесь владельцем таблицы, вы можете захотеть перестроить ее с помощью лучшего ключа распределения, имея в виду, что это будет медленно, но производительность таблицы в будущем будет выше.

надеюсь, это поможет.

person user3443421    schedule 20.03.2014

Пробовали ли вы вариант CTAS (Создать таблицу как...), при этом данные параметра CTAS распределяются только в срезах данных без участия хоста. Так что это более быстрый и простой способ.

person Varun Bajaj    schedule 13.03.2014
comment
Можете ли вы предоставить мне точный синтаксис, который вы использовали? - person Varun Bajaj; 13.03.2014