Data Quality CZ - portál věnující se tématu kvalitních dat

Pyramida znalostí jako základ konceptuálního modelu datové kvality

[6.7.2011] D. Pejčoch

Se stále rostoucím objemem zpracovávaných dat ve firmách i státních organizacích narostl jejich význam co by nutného zdroje jak pro běžný provoz instituce, tak i pro analytické úlohy a reporting (souhrnně Business Intelligence). Na každé úrovni používání dat se setkáváme s problémem datové kvality. Na každé úrovni má trochu jiný rozměr a tak i zjištěné defekty různé důsledky. Pojďme nyní tato tvrzení opřít o reálné argumenty. Prof. Zelený svého času publikoval práci [3], která do značné míry dává porozumět důvodu, proč má smysl zabývat se datovou kvalitou, byť tento záměr zřejmě v době jejího vzniku nesledoval. Vychází z konceptu tzv. pyramidy znalostí (DIKW, Data-Information-Knowledge-Wisdom Hierarchy, ...), která demonstruje vztah dat, informací, znalostí a "moudrosti".

S pravděpodobně prvním náznakem rozdílu mezi zmíněnými pojmy se lze setkat ve hře "The Rock" T. S. Elliota (1934). Mnohokráte citované verše "Where is the Life we have lost in living? Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information?" však dávají jen nepřímo tušit hierarchii, jejíž autorství je často mylně připisováno průkopníku v oblasti operačního výzkumu, systémového uvažování a vědeckého managementu, Russellu Ackoffovi. Navzdory všem dohadům, první odbornou publikací na téma pyramida znalostí je práce již zmiňovaného M. Zeleného. Od jejího vydání bylo téma zpracováno v mnoha odborných publikacích a stalo se předmětem zájmu řady diskusních fór a weblogů. O populárnosti konceptu svědčí i fakt, že jej, byť v modifikované podobě, zmínil v textu jedné z písní alba Joe's Garage slavný americký skladatel a kytarista Frank Zappa.

Pokud bychom chtěli přesněji definovat jednotlivé stupně pyramidy, data bychom považovali za jakési základní diskrétní stavební prvky informací, reprezentované podle různé míry strukturovanosti fakty uloženými v datových atributech, textových dokumentech, zvukových záznamech či formou obrazu/videozáznamů. Informacemi bychom potom rozuměli data zasazená do kontextu a zřetězená ve vyšší smysluplné celky mající určitý význam (např. konkrétní osoba s příjmením Novák si v roce 2011 sjednanala pojištění domácnosti s výší krytí ...). Znalosti získáme začleněním dat a informací do souvislostí, které mohou dát vyniknout dosud skrytým vzorům. Konečně moudrost představuje aplikované znalosti. Vztah lze též v kostce vyjádřit (viz[2]) následující formulací: porozuměním vztahům mezi daty získávám informace, porozuměním vzorům v rámci informací získávám znalosti a porozuměním principům na základě znalostí získávám moudrost. Vztah jednotlivých úrovní je nutné pochopit, mimo jiné proto, abychom porozuměli důvodům, proč se v některých publikacích setkáváme s pojmem "kvalita dat" a v jiných s pojmem "kvalita informací". Jak se přesvědčíme dále, nutnou podmínkou kvalitních informací jsou kvalitní data.

Prof. Zelený ve své práci šel ještě dál a jednotlivým vrstvám pyramidy přidal význam systémů, které s danou úrovní pracují. Datům odpovídají provozní systémy, informacím manažerské informační systémy (MIS), znalostem expertní systémy a moudrosti systémy pro podporu strategického rozhodování. Takto modifikovaná pyramida znalostí nám již může posloužit jako základ konceptuálního modelu řízení datové kvality, byť ještě s nutnou drobnou úpravou. Jsem toho názoru, že pokud již vztahujeme úrovně znalostí k jednotlivým systémům používaným v rámci firem, je vhodnější pro nejvyšší úroveň hierarchie použít pojem "vize" misto "moudrost". Tento pojem lépe koresponduje s chápáním strategického řízení firmy. Zároveň však vychází z pojmu původního, neboť pro vytváření správných vizí je bezesporu nutunou podmínkou určitá "moudrost" jejich tvůrců.

Popis kauzalit mezi jednotlivými úrovněmi modifikované pyramidy znalostí by mohl vypadat například takto: Mám-li špatná data (neúplná, chybná, roztroušená,…), nemohu očekávat, že je budu interpretovat správně a získám správné informace (jak pregnantně vyjadřuje již notoricky známé rčení „garbage in, garbage out“). Na jejich základě nemohu získat správné znalosti a v jejich důsledku vytvořím chybné vize. Tento modifikovaný koncept názorně demonstruje potenciální dopad chybné základny pyramidy. Současně ukazuje, že problematika kvality dat není v kontextu celé firmy a dokonce ani v kontextu řízení informatiky co by za data primárně zodpovědné organizační jednotky osamocena, bez jakékoliv interakce s ostatními aktivy a dalšími oblastmi řízení.

Použitá literatura

Komentáře ke článku

Stránka byla naposledy aktualizována dne 4.5.2015
Powered by HOLOPAGE
©2011 - 2015 D. Pejčoch