Rozdíl mezi tabulkou faktů a tabulkou rozměrů

Autor: Laura McKinney
Datum Vytvoření: 1 Duben 2021
Datum Aktualizace: 10 Smět 2024
Anonim
Rozdíl mezi tabulkou faktů a tabulkou rozměrů - Technologie
Rozdíl mezi tabulkou faktů a tabulkou rozměrů - Technologie

Obsah


Tabulka faktů a tabulka rozměrů jsou základními faktory pro vytvoření a schéma. Záznam tabulky faktů je kombinací atributů z tabulek různých dimenzí. Fakta tabulka pomáhá uživateli analyzovat obchodní dimenze, což mu pomáhá při rozhodování o zlepšení jeho podnikání. Na druhé straně, tabulky rozměrů pomáhají tabulce faktů shromažďovat rozměry, podél kterých musí být přijata opatření.

Bod, který rozlišuje faktickou tabulku a tabulku rozměrů, je ten, že rozměrová tabulka obsahuje atributy, podle kterých jsou prováděna opatření tabulka faktů. Existuje několik dalších faktorů, které vytvářejí rozdíly mezi tabulkou faktů a tabulkou dimenzí a zobrazují je. Podívejme se na následující srovnávací graf.

  1. Srovnávací tabulka
  2. Definice
  3. Postava
  4. Klíčové rozdíly
  5. Závěr

Srovnávací tabulka

Základ pro srovnáníTabulka faktůTabulka rozměrů
ZákladníFakta tabulka obsahuje měření podél atributů tabulky rozměrů. Tabulka dimenze obsahuje atributy, podle nichž tabulka faktů vypočítává metriku.
Atribut a záznamy Fakta tabulka obsahuje méně atributů a více záznamů.Tabulka rozměrů obsahuje více atributů a méně záznamů.
Velikost stoluTabulka faktů roste svisle.Tabulka rozměrů roste vodorovně.
Klíč Fakta tabulka obsahuje primární klíč, který je zřetězením primárních klíčů všech rozměrových tabulek. Každá tabulka rozměrů obsahuje svůj primární klíč.
StvořeníFakční tabulku lze vytvořit pouze po dokončení tabulek rozměrů.Nejprve je třeba vytvořit kótovací tabulky.
Schéma Schéma obsahuje menší počet faktických tabulek.Schéma obsahuje větší počet tabulek dimenzí.
AtributyFakta tabulka může mít data v číselném i ual formátu.Tabulka rozměrů vždy obsahuje atributy ve formátu ual.


Definice faktické tabulky

Tabulka faktů je tabulka, která obsahuje Měření podél atributů rozměrových tabulek. Může obsahovat informace na nejnižší možné úrovni. Některá tabulka faktů obsahuje pouze souhrnná data zvaná jako Agregovaná tabulka faktů. Skutečnost tabulka téměř obsahuje datum vyraženo data. Pojďme diskutovat o vlastnostech tabulky faktů.

Zřetězený klíč
Tabulka faktů obsahuje Zřetězený klíč, který je zřetězením primárních klíčů všech rozměrových tabulek. Zřetězená tabulka faktů musí jednoznačně identifikovat řádek v tabulce faktů.

Datové zrno
Datové zrno ukazuje, jak hluboko byla ve skutečnosti uložena měření ve skutečnosti. Datové zrno musí být na nejvyšší možné úrovni.


Aditivní opatření
Atributy tabulky faktů mohou být plně aditivní nebo polo aditivní. Plně aditivní opatření jsou ta, která lze snadno shrnout pro všechny rozměry ve skutečnosti tabulky. Například Quantity_ordered, je atribut, který lze sečíst pro všechny dimenze. Stejně tak můžeme pro konkrétní zákazníka, region, datum, značku atd. Odebrat celkové množství. Semi-aditivní opatření jsou ta, která lze shrnout podle některých rozměrů tabulky faktů, ale ne všech dimenzí. Stejně jako zůstatek nelze sčítat podle časové dimenze, protože se v průběhu času mění.

Řídká data
Někdy můžeme vidět záznamy ve skutečnosti tabulky, která má atributy s nulové míry. Například na dovolenou nemusí být žádná objednávka. Atributy pro toto datum tedy budou mít nulové míry. Nemusíme ukládat opatření pro takový druh záznamů, protože neposkytují žádné informace.

Degenerované rozměry
Ve skutečnosti se někdy můžete setkat s některými rozměry ve skutečnosti tabulky, které nejsou vůbec aditivní. Například order_number, customer_id, nemůžete přidat tyto typy dimenzí. V případě, že však potřebujete najít objednávku konkrétního zákazníka v tomto měsíci; pak budete potřebovat customer_id k propojení vašeho vyhledávání. Tyto typy, pokud jsou volány atributy nebo rozměry faktické tabulky Degenerovaná dimenze.

Definice rozměrové tabulky

Tabulka kót je klíčovou komponentou pro schéma Schéma. Tabulka kót obsahuje atributy, které představují kóty, podél nichž se měření provádí ve skutečnosti. Dále se budeme zabývat některými charakteristikami tabulky rozměrů.

Atributy a klíče
Každá tabulka rozměrů musí mít a primární klíč který jedinečně identifikuje každý záznam tabulky. Je běžně pozorováno, že tabulka rozměrů obsahuje mnoho atributů. Zdá se tedy, že je široký tj. když vytvoříte tabulku rozměrů, zjistíte, že se šíří vodorovně.

Hodnoty atributů
Hodnoty atributů v tabulce rozměrů jsou zřídka číselné, většina časů najdete hodnoty v atributech jsou ual formát. Například název produktu, značka, kategorie, podkategorie atd.

Vztah mezi atributy
Často můžete pozorovat, že atributy, na které narazíte v tabulce rozměrů, přímo nesouvisejí. Stejně jako Product_brand nemusí nic dělat s package_date, ale oba mohou být atributy tabulky dimenzí produktu.

Normalizace
Tabulka rozměrů je ne měl být Normalizováno. Důvodem je, že normalizace tabulky by vytvořila mnoho mezilehlých tabulek. Když dotaz vyzvedne atribut z tabulky rozměrů a získá měření podél toho pro tabulku faktů, dotaz musí projít ty mezilehlé tabulky, které se stanou neefektivní. Tabulky dimenzí tedy nejsou normalizovány.

Vrtání, válcování nahoru
Atributy tabulky rozměrů umožňují získat podrobnosti buď přechodem z vyšší úrovně agregovaných atributů na atributy nižší úrovně. Například, pokud chcete najít celkový prodej v regionu, můžete rozbalit a vyhledat prodej podle státu, města, zipu. Dokonce se můžete vrátit, abyste zjistili celkový prodej nejprve podle zipu, poté podle města a poté státu.

Více hierarchie
Tabulka rozměrů často nabízí více hierarchií. Máme například tabulku rozměrů produktu pro obchodní dům. Nyní máme dvě oddělení marketingové a účetní oddělení.

Marketingové oddělení se rozbalí mezi atributy tabulky rozměrů produktu v určité hierarchii, aby získalo měření pro tabulku faktů.

Na druhé straně bude účetní oddělení procházet mezi atributy tabulky rozměrů produktu v různé hierarchii, aby získalo měření pro tabulku faktů.

Tabulka dimenze tedy musí mít více hierarchií nebo úroveň agregace atributů, aby uživatel mohl procházet jakoukoli z více hierarchií.

Evidence
Ačkoli tabulka rozměrů má příliš mnoho atributů, má méně záznamů.

  1. Fakta tabulka obsahuje měření podél kóty / atributů tabulky rozměrů.
  2. Fakta tabulka obsahuje více záznamů a méně atributů ve srovnání s tabulkou rozměrů, zatímco tabulka rozměrů obsahuje více atributů a méně záznamů.
  3. Tabulka velikostí tabulky faktů roste svisle, zatímco velikost tabulky tabulky rozměrů roste vodorovně.
  4. Každá tabulka rozměrů obsahuje primární klíč k identifikaci každého záznamu v tabulce, zatímco tabulka faktů obsahuje zřetězený klíč, který je kombinací všech primárních klíčů všech tabulek rozměrů.
  5. Dimenzační tabulka musí být zaznamenána před vytvořením faktické tabulky.
  6. Schéma obsahuje méně tabulek faktů, ale více tabulek dimenzí.
  7. Atributy ve skutečnosti jsou číselné i ual, ale atributy tabulky rozměrů mají pouze atributy ual.

Závěr:

Oba jsou stejně důležité pro vytvoření schématu, ale tabulka rozměrů musí být zaznamenána před tabulkou faktů. Protože je nemožné vytvořit tabulku faktů bez vnějších rozměrů.