Основным недостатком является увеличение размера записей таблицы фактов. Вы не указываете размеры строк, но добавление новых внешних ключей может значительно повлиять на размер строки.
В большинстве баз данных увеличение размера строки в таблице фактов замедлит выполнение запросов. Однако в столбцовой базе данных это не будет проблемой.
На самом деле увеличение размера может перевесить преимущества отказа от объединений.
В общем, я бы не беспокоился о соединениях в таблицах измерений малого и среднего размера, которые относятся к первичному ключу. То есть сделать много тестов на полномасштабных данных, прежде чем вносить такие радикальные изменения.
Влияние на insert
s заключается просто в том, что ключи должны быть проверены. Однако это проверка первичных ключей справочных таблиц, поэтому эти проверки выполняются довольно быстро. Больше явно дороже, чем меньше, но накладные расходы, вероятно, не станут решающим фактором.
Одна вещь, которая может быть преимуществом или недостатком, заключается в том, что размеры являются статическими во время ввода. Обновление таблицы фактов, как правило, довольно дорого. Однако размеры меняются. Например, время от времени создаются новые страны. Как это отражено в исторических данных?
В схеме снежинки ваш самый низкий уровень географии (вероятно) будет более точным, чем страна, и необходимо обновить только размеры. И если в таблице фактов необходимо обновить самый нижний уровень, это повлияет на относительно небольшое количество строк.
person
Gordon Linoff
schedule
15.08.2019