Data Quality CZ - portál věnující se tématu kvalitních dat

Vlastnosti dat a způsob jejich měření

[24.1.2011] D. Pejčoch
Vlastnost dat Popis vlastnosti Způsob měření
Endogenní dimenze Důvěryhodnost Míra všeobecné akceptovatelnosti dat jejich uživateli Např. dotazníkové šetření, interview s uživateli
Unikátnost Podíl nechtěných duplicitních záznamů v databázi nebo mezi databázemi Shluková analýza podle porovnávacích kódů
Semantická správnost Podíl chybně přiřazených hodnot atributu Porovnávací funkce, Popisné statistiky (určení potenciálně chybných odlehlých hodnot) v rámci Profilingu dat
Syntaktická správnost Podíl nesmyslných hodnot pro daný typ atributu Porovnávací funkce v rámci Profilingu dat
Časové dimenze Životnost Podíl zjevně neaktuálních hodnot Stáří dat při získání poslední aktuální hodnoty + (Čas posledního získání aktuální hodnoty - Čas posledního vložení do IS)
Včasnost Váha odpovídající frekvenci loadu max{0,1 - životnost / volatilita}
Volatilita Váha odpovídající frekvenci změn v reálném světě Doba po kterou data zůstávají platná, tj. např. průměrná doba platnosti daného atributu (např. pro daný behaviorální segment).
Časová synchronizace Míra synchronizace mezi zdroji s různým časovým razítkem Odpovídá frekvenci loadu - v podstatě se jedná o rozídl vložení do IS a čas posledního získání aktuální hodnoty - viz. Životnost
Kontextuální dimenze Konzistentnost Míra splnění integritních omezení
Úplnost Podíl chybně nevyplněných hodnot Podíl chybně nevyplněných hodnot daného atributu k celkovému počtu záznamů dané entity
Pokrytí Podíl případů, kdy atribut neobsahuje všechny potenciální hodnoty
Dimenze užití Dostupnost Míra dostupnosti dat pro uživatele Podíl uživatelů, kteří mají přístup k danému atributu k počtu uživatelů, u nichž by bylo žádoucí, aby měli přístup k danému atributu (např. na základě přiřazení kompetence k danému pracovnímu zařazení)
Srozumitelnost Míra srozumitelnosti dat pro jejich uživatele Např. dotazníkové šetření, interview s uživateli.
Interoperabilita Míra existence dokumentace a metadat pro korektní interpretaci dat Podíl atributů obsažených v datovém slovníku k počtu netechnických atributů obsažených v systémech.

Komentáře ke článku

Stránka byla naposledy aktualizována dne 4.5.2015
Powered by HOLOPAGE
©2011 - 2021 D. Pejčoch