Свързани публикации 'data-warehouse'


Шест недооценени принципа на съхранение на данни, през очите на специалист по данни
Стабилната стратегия за вашето хранилище за данни може да бъде разликата между организация за наука за данни от световна класа и голямо разпределение в баланса ви, което е посветено на тъпченето на вода. След като съм работил в областта на науката за данни в три много различни организации, съм изпитал доброто, лошото и грозното на складирането на данни. От тези преживявания съм съставил разнообразен набор от „принципи“, които от моя гледна точка могат да останат недооценени. В тази..

Не премествайте данните си!
Ако сте ангажирани във вълнуващия свят на машинното обучение, поздравления! Ние сме в ключов момент в AI, с безпрецедентен достъп до данни/изчисления и новаторски техники, които продължават да ни изненадват редовно. Но докато ти и аз нямаме търпение да играем със следващия трансформатор / GPT-x / SSL / RL алгоритъм/модел, ние всички разбираме реалността, че 80% от работата в анализа на данни е в събирането на подбрани висококачествени данни [1] . Така че основна необходимост, която..

Свързани въпроси 'data-warehouse'

Използване на поле DATE като първичен ключ на измерение на дата с MySQL
Искам да обработвам измерение на дата в хранилище за данни MySQL. (Аз съм начинаещ в света на DW) Направих няколко търсения с google и видях много структури на таблици (повечето) измерение на дата, където първичният ключ е прост UNSIGNED INTEGER...
19091 изгледи
schedule 20.09.2022

сливане в oracle сравняване на дати
Искам да предам FromDate и ToDate в процедура и след това да актуализирам и вмъкна стойности, както следва. Таблиците student и studLoad имат по 3 полета: id, name и insertDate. create or replace procedure incload(f_date date,t_date date) is...
183 изгледи
schedule 26.09.2022

продължителност на филтъра
Трябва да изчисля времето, което е между 8 сутринта и 10 вечерта. Друг път не ми трябва. и сега правя това с Excel и искам да автоматизирам процеса Имам следната таблица, събития start_date | end_date | duration_REAL |...
114 изгледи
schedule 15.09.2022

Звездна схема много към много за данни от времеви серии
Имам въпрос за моделиране на DataWarehouse / звездна схема. Имам показания на измервателните уреди (факти) за различни местоположения (размери). Всяко местоположение има множество организации с различни роли. Бих искал да моделирам това в схема...
187 изгледи
schedule 16.09.2022

Говорете с таблици в стил хранилище на данни с ActiveRecord?
Докато моето приложение Rails узрява, става все по-очевидно, че има силен вкус на хранилище за данни, липсва му само таблица с факти, за да бъде всичко ясно. Освен това току-що прочетох глави 2 (Проектиране на красиви API) и 3 (Овладяване на...
2024 изгледи

SSAS взаимоотношения Бавно променящо се измерение
Имам тази структура в моето хранилище за данни DimCustomer -id (pk) -Name -Country -datestart -dateend FactBalance -idCustomer (pk) (fk [DimCustomer.id]) -idTime (pk) (fk [DimDate.DateSK]) -Balance Измерението на...
744 изгледи

Проблем с попълването на измерението на времето
Моята MySql таблица връща дни вместо време. Имам нужда от минимално ниво на минути на ден, така че 1440 записа трябва да бъдат автоматично попълнени, но продължавам да получавам дни назад. Някаква идея защо? Освен това не ми трябват секунди, а само...
911 изгледи
schedule 25.11.2023

Data Warehouse срещу OLAP Cube?
Може ли някой да обясни каква всъщност е разликата между Data Warehouse и OLAP Cubes? Те имат различен подход за едно и също нещо? Един от тях отхвърлен ли е в сравнение с друг? Има ли проблеми с производителността в един от тях? Всяко...
54837 изгледи
schedule 20.11.2022

Как да обединявам таблици без дубликати и да поддържам чужди препратки?
Създавам хранилище за данни за здравна компания. Те имат отделни бази данни за различни болници, които съдържат таблици за пациентите, тяхната застраховка и т.н., а PK е уникален само в една болнична база данни. Когато се обединят, трябва да създам...
84 изгледи
schedule 08.12.2022

Има ли някакъв метод за избиране само на нови/променени редове без колона с дата или зависимост на ред в Oracle?
Как бихте направили това? Извършвам ETL процес на бази данни, които в момента нямат колона Date_added/Date_updated. DBA не иска да добави колона за дата към таблиците, така че трябва да намеря някакъв алтернативен начин за избор само на...
1916 изгледи
schedule 27.10.2023

Групиране по срещу разделяне по в Oracle
Пиша заявка за извличане на записи от склад на Oracle. Това е проста заявка за избор с обединения на няколко таблици и имам няколко колони за агрегиране. Следователно в крайна сметка използвам Groupby за останалите колони. Да кажем, че избирам...
34740 изгледи

Обработване на промяна на зърното за таблица с факти за моментна снимка в звездна схема
Въпроса Как се справяте с промяна в зърното (от седмично измерване към ежедневно измерване) за таблица с факти за моментна снимка. Основна информация За дизайн на звездна схема искам да включа резултатите от проучване като факт (напр. през...
834 изгледи
schedule 22.01.2024

Моделиране на котва - вратовръзка: направете първа роля?
Кратък въпрос, свързан с официалния водещ модел. Докато моделирате връзки, можете да настроите свойствата на ролите, едно от тях е „първа роля“. Какво прави опцията „Създаване на първа роля“? Виждам във файла xml/sql, че той разменя реда на ролите...
162 изгледи

Извършване на заявки за данни от хранилище на данни, включващи измерение на времето
Имам две таблици за измерение на времето дата (уникален ред за всеки ден) час от деня (уникален ред за всяка минута в деня) Като се има предвид тази схема, как би изглеждала една заявка, ако искате да извлечете факти за последните X часа, където...
1753 изгледи
schedule 23.02.2024

Не може да се свърже с Azure SQL Data Warehouse грешка в базата данни Неправилен синтаксис близо до „ANSI_NULLS“
Бих могъл успешно да доставя новата база данни на Azure SQL Data Warehouse. Ако се опитам да се свържа с базата данни на SQL Data Warehouse, получавам следното съобщение за грешка: „Грешка при анализ на ред: 1, колона: 5: Неправилен синтаксис...
2431 изгледи
schedule 18.02.2024

Може ли Oracle 10g да се използва за многоизмерно хранилище на данни?
Нов съм в складирането на данни и просто ми беше любопитно да знам дали oracle 10g или MySql могат да се използват за многоизмерно хранилище на данни или можем да използваме само нещо като Hyperion?
83 изгледи
schedule 04.03.2024

Изчислен член на SSAS
Имам куб с мярка, наречен FactSales, който има записи за всеки ден. Имам три измерения, дата, клиент и тип клиент. Всеки ред на FactSales е свързан с дата и клиент чрез външен ключ. клиентът е свързан с типа клиент чрез външен ключ. От това...
126 изгледи
schedule 05.03.2024

Просто пояснение относно логиката на информационното картографиране
Трябва да работя върху трансформацията. Може ли някой да ми помогне да напиша заявка за трансформацията по-долу Source Column name (from lookup) Source table (local_usr_tbl) Lookup_1:(rpt_user_tbl) INPUT CON_NUM,ML_SYMBL...
630 изгледи

Объркване в дизайна на таблицата с факти - изчислени мерки и други
Аз съм съвсем нов в складирането на данни и моделирането на размерите и имам нужда от разяснение относно няколко неща. В момента имам следните размери: DimProducts - Информация за продукт. DimMaterials – Информация за материалите, които...
812 изгледи

искате да създадете склад за данни нова база данни или просто да натрупате таблиците в съществуващата база данни?
Така че имам MySQL база данни за уеб общност, която е потенциална златна мина за статистика. В момента обслужвам статистика, изградена чрез всякакви неприятни заявки в моята добре нормализирана база данни. Изпаднах в „ограничението на търпението“ за...
841 изгледи
schedule 05.04.2024