Обработка изменения зернистости таблицы фактов моментального снимка в звездообразной схеме

Вопрос

Как вы справляетесь с изменением зернистости (от еженедельного измерения к ежедневному) для таблицы фактов моментального снимка.

Справочная информация

Для звездообразной схемы я хочу включить результаты опроса как факт (например, на 2-й неделе 2015 года 80% респондентов ответили «да», на 3-й неделе - 76% и т. Д.). Этот опрос проводится каждую неделю. , и у меня есть доступ только к результатам опроса (% людей, ответивших «да» на этой неделе), а не к отдельным ответам.

Основываясь на (моей интерпретации) «Звездной схемы: полная справка» Кристофера Адамсона, я считаю, что для такого рода измерений мне следует использовать таблицу фактов снимок.

Измерение даты для этого факта должно быть на уровне недели и представлять собой согласованное сведение более детального измерения даты для других фактов в других звездах, которые происходят ежедневно.

Здесь приходит беда

Теперь кто-то решает, что они хотят проводить эти опросы ежедневно, а не еженедельно. Как лучше всего с этим справиться? Некоторые из вариантов, которые я сейчас рассматриваю:

  • измените измерение недели на ежедневное и подделайте старые факты, как если бы они произошли в последний день недели.
  • измените измерение недели на ежедневное и добавьте 7 фактов для каждого еженедельного измерения.
  • создать новую звезду с повседневными фактами и измерениями и рассматривать старую как совокупность.

Буду признателен за любой вклад. Скажите, пожалуйста, моя логика не в порядке, или мой вопрос непонятен :)


person thijsvdanker    schedule 28.04.2015    source источник
comment
Добавлена ​​справочная информация, чтобы отразить, что у меня нет доступа к отдельным ответам, поскольку комментарий Рона Данна был бы действителен, если бы я имел.   -  person thijsvdanker    schedule 29.04.2015


Ответы (1)


Я не уверен, что это снимок. Каждый ответ на опрос представляет собой «транзакцию».

С соответствующим измерением даты вы можете рассчитать процентное соотношение Да / Нет, свернутое по неделям.

Кроме того, это позволит вам отображать такие результаты, как «Опросы, проведенные в воскресенье вечером, получают больше ответов» или «Люди, которые отвечают в пятницу, с большей вероятностью ответят« Да »». (надуманные примеры)


После пояснения это действительно похоже на периодический снимок. Пример сальдо банковского счета часто используется для описания подобного сценария.

Ключевой особенностью периодических снимков является то, что должны присутствовать все комбинации каждого измерения. Если у вас зерно ежемесячно, то каждый месяц вы фиксируете этот факт, даже если он не изменился по сравнению с предыдущим месяцем.

Я думаю, это ключ к твоей проблеме. Зная, что количество зерновых может меняться от еженедельной к ежедневной, производите зерно ежедневно. Это означает, что вы будете повторять недельное значение каждый день недели, но это истинное представление о том, что вы знаете об этом факте; в среду вы знали только, что его значение было таким же, как и в понедельник.

Если вы правильно спроектируете свой ETL, вам не нужно будет вносить какие-либо изменения, когда начнутся ежедневные обновления.

Ваш второй вариант - тот, который я бы выбрал вместо вас.

person Ron Dunn    schedule 28.04.2015
comment
Я ожидаю, что ОБСЛЕДОВАНИЕ проводится в течение нескольких дней, например, одного месяца, но каждый ОТВЕТ происходит в определенный день в этом диапазоне. Ваша транзакция - это ОТВЕТ. Я неправильно понял сценарий? - person Ron Dunn; 29.04.2015
comment
Хотел отредактировать свой комментарий, но не смог :) В моем случае у меня есть доступ только к общему результату опроса (количество респондентов на этой неделе +% ответивших «да»). Поэтому я не могу сказать, когда произошли отдельные ответы. - person thijsvdanker; 29.04.2015
comment
Еще один вопрос :) Важна ли концепция времени? Если бы вы использовали снимок, на котором DATE не было измерением, смогли бы вы добиться своего результата на основе этих фактов? Ответ на этот вопрос поможет мне выбрать, какую из двух альтернатив обсудить. - person Ron Dunn; 29.04.2015
comment
Да, это важно, поскольку результаты опроса сравниваются с посещениями веб-сайтов за тот же период. Я ценю помощь, Рон! - person thijsvdanker; 29.04.2015
comment
Ваше решение практично и подходит для моей ситуации, поэтому я принял ответ и буду реализовывать его таким образом. Немного странно называть это фактом ... поскольку ничего не произошло и ничего не проверялось (возможно, меньше людей ответили бы "да", если бы их спросили в тот день), но это соответствует моим потребностям. Может быть, я скажу зерно как известный процент ... чтобы было очевидно, что это не измеренный процент - person thijsvdanker; 30.04.2015