Понимание распределения

У меня есть несколько вопросов.

  1. Я хотел бы знать, нужно ли нам беспокоиться о распределении в Netezza, используя только операторы выбора (не создавая таблицы). В основном я пытаюсь создать набор данных в SAS, подключившись к Netezza и выбрав представление с несколькими соединениями. Мне интересно, как это повлияет на производительность Netezza, если я создам таблицу непосредственно в SAS.

  2. Я создаю таблицу, объединяя две другие таблицы по идентификатору customer_id. Однако выходной набор данных не состоит из столбца customer_id. Могу ли я распространять эту таблицу на customer_id?

Спасибо.


person Himanshu Gupta    schedule 06.10.2014    source источник


Ответы (1)


Что касается вашего первого вопроса, вам обычно не нужно беспокоиться о распределении, если вы не создаете таблицу. Это помогает понять методы распределения для таблиц, из которых вы выбираете, но это, конечно, не требование. Наличие метода распределения, который поддерживает определенные соединения, которые вы выполняете, безусловно, может повысить производительность во время выбора (например, если ваши столбцы соединения являются надмножеством столбцов распределения, вы получите совмещенные соединения), но если целью вывода является SAS, то запись набора данных в SAS никак не повлияет.

Что касается вашего второго вопроса, таблица распределяется либо по столбцу, либо по столбцам в самой таблице, либо с помощью метода распределения RANDOM (он же циклический). В вашем случае, если вы храните свой набор данных в таблице на Netezza, вы не можете распространять данные по customer_id, поскольку этот столбец не включен в набор данных.

person ScottMcG    schedule 17.10.2014