Rozdíl mezi těžbou a skladováním dat

Autor: Laura McKinney
Datum Vytvoření: 2 Duben 2021
Datum Aktualizace: 6 Smět 2024
Anonim
Rozdíl mezi těžbou a skladováním dat - Technologie
Rozdíl mezi těžbou a skladováním dat - Technologie

Obsah


Data Mining a Data Warehousing se používají k uchovávání obchodních informací a umožňují rozhodování. Těžba a skladování dat však mají různé aspekty fungování podnikových dat. Na jedné straně datový sklad je prostředí, ve kterém se data podniku shromažďují a ukládají agregovaným a souhrnným způsobem. Na druhou stranu, dolování dat je proces; které používají algoritmy k získání znalostí z dat, o kterých ani nevíte, že v databázi existují.

Podívejme se na rozdíl mezi dolováním dat a datovým skladováním pomocí níže uvedené srovnávací tabulky.

  1. Srovnávací tabulka
  2. Definice
  3. Klíčové rozdíly
  4. Závěr

Srovnávací tabulka

Základ pro srovnáníTěžba datSkladování dat
Základní Dolování dat je proces získávání nebo extrahování smysluplných dat z databáze / datového skladu.Datový sklad je úložiště, ve kterém jsou informace z více zdrojů uloženy v jediném schématu.


Definice dolování dat

Dolování dat je proces objevovat znalosti, které vy nikdy nečekal na existují ve vaší databázi. Pomocí tradičního dotazovacího nástroje můžete z dat získat pouze známé informace. Dolování dat vám však nabízí cestu načíst skryté informace z dat. Dolování dat extrahuje smysluplné informace z databáze, pro kterou lze použít rozhodování.

Zjištění znalostí v databázích, označované jako KDD, exponáty vztah a vzor. Vztah může být mezi dvěma nebo více různými objekty, mezi atributy stejného objektu. Vzor je dalším výsledkem dolování dat, který ukazuje pravidelnou a srozumitelnou posloupnost informací, které pomáhají při rozhodování.


Kroky zahrnuté v KDD, tj. Zjišťování znalostí v databázích, lze shrnout jako první, výběr souboru dat, na kterém musí být provedeno dolování dat. Další je předzpracování které zahrnují odstranění nekonzistentních dat. Pak přijde transformace dat kde jsou data transformována do formy vhodné pro dolování dat. Další je dolování dat, zde se na data aplikují algoritmy dolování dat. A nakonec, interpretace a hodnocení které zahrnují extrahování vztahu nebo vzorce mezi daty.

Dolování dat dobře zapadá do prostředí datového skladu, který uložil data agregovaným a souhrnným způsobem. Jak je snadné těžit data v datovém skladu

Definování datového skladu

Datový sklad je centrální místo, kde informace shromážděné z více zdrojů jsou uloženy v rámci jednoho sjednoceného schématu. Data se zpočátku shromažďují, různé zdroje podniku se poté vyčistí a transformují a uloží do datového skladu. Jakmile jsou data vložena do datového skladu, zůstane tam po dlouhou dobu a lze k nim přistupovat přesčas.

Data Warehouse je perfektní směs technologií jako modelování dat, získávání dat, správa dat, správa metadat, vývojové nástroje správy obchodů. Všechny tyto technologie podporují funkce jako extrakce dat, transformace dat, ukládání dat, poskytování uživatelských rozhraní pro přístup k datům.

Datový sklad není produkt nebo software, je to informační prostředí, které poskytuje informace jako integrovaný pohled na podnik. Máte přístup k aktuálním a historickým údajům podniku, což pomáhá při rozhodování. Podporuje transakce prováděné pro rozhodování bez ovlivnění operačních systémů. Je to flexibilní zdroj k získání strategických informací.

  1. Existuje základní rozdíl, který odděluje dolování dat a ukládání dat, což je dolování dat je proces extrahování smysluplných dat z velké databáze nebo datového skladu. Datový sklad však poskytuje prostředí, ve kterém jsou data uložena v integrované formě, která usnadňuje těžbu dat pro efektivnější extrakci dat.

Závěr:

Dolování dat lze provést pouze tehdy, existuje-li dobře integrovaná rozsáhlá databáze, tj. Datový sklad. Proto musí být datový sklad dokončen před těžbou dat. Datový sklad musí mít informace v dobře integrované formě, aby těžba dat mohla extrahovat znalosti efektivním způsobem.