Data Quality CZ - portál věnující se tématu kvalitních dat

Proč kvalita dat nepřináší přínosy?

[1.10.2013] M. Kučera (Certified TIQM Professional - Freelancer)

Článek se zamýšlí nad současným stavem kvality dat a snaží se nastínit řešení, zajišťující skutečné přínosy v této oblasti.

Úvod

Kvalita dat je disciplínou existující na našem trhu již více jak 10 let. Je možná čas, se nad touto oblastí zamyslet a podívat se na ni z trochu jiného úhlu pohledu.

Na jedné straně přinesla nové téma, které bylo určitou dobu zanedbáváno, resp. nebylo ve společnostech na „programu dne“ (ne že by tomu bylo i dnes) a zároveň s sebou přinesla nové technologie jako je profiling a cleansing.

Pokud se podíváme retrospektivně, pak problematika kvality dat byla transformována na dva základní procesy „profiling“ a „cleansing“. Toto bylo, a mnohdy stále je, považováno za přístup zajišťující organizacím benefity. Bohužel realita je opačná. Na základě posledního výzkumu pana Larryho P. Englishe (zakladatele této problematiky) se ukazuje, že náklady na nekvalitní informace za posledních 10 let (tj. 2000 – 2010) vzrostly z původních 15%-25% na současných 20% - 35% revenue společnosti / firmy. Domnívám se, že toto jednoznačně poukazuje na skutečnost, že masivní inspekce „profilingu“ a „čištění dat“ není tou správnou cestou k eliminaci nadbytečných nákladů souvisejících s nekvalitními informacemi.

Zúžení celé oblasti datové kvality (o to více pak informační kvality) pak vedlo k tomu, že management společností se začal ptát na přínosy. Tyto nebyly dokladovány a tak se na některých sociálních sítích objevila témata jako: „Proč CxO role odmítají datovou kvalitu“, „Co je kvalita dat – náklad, přínos“ a mnohé další, podobné otázky.

Nedávno jsem hovořil s D. Laney (zakladatel oblasti zvané Infonomics), ze společnosti Gartner, který mi potvrdil, že zájem o problematiku kvality dat klesl a je relativně malý. Důvodem, je skutečnost, že po dlouhou dobu se nepodařilo obchodním útvarům a vedením společností prezentovat měřitelné a prokazatelné přínosy. V posledních letech se pak objevil koncept „data governance“. Podle mne se jedná pouze o módní, marketingové spojení. Důvodem je skutečnost, že se jedná o zavedení procesů, technik, metodik, nástrojů pro podporu této oblasti. Avšak pokud se podíváme na jiné systémy kvality, jako Six Sigma, TQM a podobně, pak i zde by se měl termín governance objevit. Nevím, zda jsem hledal dobře, ale bohužel jsem jej nenašel. Z mého pohledu je pak zcela dostačující termín „řízení“ („management“).

Proč datová kvalita nepřinesla výsledky?

Kvalita dat se soustředí na zhodnocení kvality dat již uložených v podnikových systémech (jejich databázích). To znamená, že se jedná již o data, která jsou uložena, a prostředky profilingu nezjišťujeme nic jiného, než technický stav dat, který ukazuje pak na skutečnost, zda jsou definovány formáty pro uložení dat, zda data odpovídají povoleným hodnotám, zda jsou naplněna obchodní pravidla (business rules) atd. S využitím odpovídající technologie, jsou pak generovány poměrně rozsáhlé statistiky.

Po prezentaci těchto výsledků je pak proveden tzv. „data cleansing“ („čištění dat“). S využitím této technologie pak „opravíme“ data tak, že opravíme překlepy, doplníme některá popisná, a nebo orientační čísla v adresách, přeformátujeme telefonní číslo na standardní formát – např. (+XXX) XXX XXX XXX atd. Poté je proveden znovu profiling (inspekce dat) a, jaké pak překvapení, kvalita vypadá lépe. Firma za tuto službu (projekt) zaplatila nemalé finanční prostředky pohybující se v částkách stovek tisíc až jednotkách milionu korun, pak se musíme ptát po přínosech tohoto projektu.

Jsem přesvědčen o tom, že výsledek, mimo zlepšení „technických statistik“ je poměrně diskutabilní, a to proto, že jak obchodní (business) tak i rozhodovací (decision) procesy vyžadují přesné informace vůči realitě. To však nástroje pro čištění dat nezajistí. Dalším problémem procesu „čištění dat“ je možnost změny přesného záznamu za chybný. Pokud se zaměříme např. na adresní údaje, pak v případě některých ulic (zejména těch značně dlouhých) lze zjistit, že určité číslo může být jak orientační, tak i popisné, apod. Podobně je tomu s opravou telefonních čísel – zlepšíme formát, ale požadavkem business, zejména sales, marketingu, právního oddělení je kontakt s klientem. Tady narážíme na velice diskutovaný problém a to „přesnost“ („accuracy“) a „správnost“ („validity“). Tyto pojmy jsem diskutoval v několika předcházejících článcích.

Výsledkem tohoto projektu, byť zjednodušeně, je – zlepšení technické kvality dat, a nekvantifikované přínosy. A tedy, opět management společnosti je utvrzen v to, že kvalita dat, jako disciplína, je pouze o nákladech a diskutabilních přínosech. Pokud se podíváme na výše uvedený proces z pohledu obecných principů řízení kvality, pak se profiling a čištění dat „pohybuje“ v kategoriích: inspekce, opravy a korekce. Spojíme-li to s dalším standardním nástroje managementu kvality – COQ (costs of quality) – náklady na kvalitu, pak inspekce a opravy a korekce jsou pouhé náklady!

Co říci závěrem? Takto pojaté projekty kvality dat, pouze „spolykaly“ nemalé finanční prostředky, utvrdily tak management, že se jedná pouze o náklady, a neprezentovaly skutečné přínosy – tj. redukci nákladů vyvolaných nekvalitními informacemi, nikoliv daty! Výsledek? Opadající zájem o tuto problematiku neboť podniky v současné době hledají cesty k redukci nákladů, což stávající pojetí projektů kvality dat – nezaručují.

Zapomeňte na kvalitu dat, věnujte se kvalitě informací

Všem je velice dobře známá následující pyramida. Z ní je celkem zřejmé, že data jsou základním stavebním kamenem informace. A pokud jsme i procesně orientovaní, pak je zřejmé, že informace je jedním ze základních vstupů jak podnikových, tak i rozhodovacích procesů.

Obrázek 1: Hierarchie znalostí

Nekvalitní informace, tak na úrovni procesu vyvolávají nadbytečné aktivity. Pokud opět použijeme termín z oblasti řízení kvality, pak hovoříme o tzv. muda. Jde tedy o nadbytečné náklady, které prodražují proces jako takový a dále má negativní dopad na efektivnost a efektivitu procesu jako takového.

Asi nejlepším případem „muda“ je Centrální registr vozidel. Použijeme-li pouze dostupné zdroje informací, pak lze identifikovat následující problémy:

Registr aut by měl pracovat s informacemi, které jsou přesné z hlediska reality. Na základě dostupných článků lze říci, že migrace dat byla provedena, kontrola (třeba i profiling) mohl ukázat, že data jsou správná (validní), ale bohužel jsou nepřesná.

Podobné dopady lze identifikovat u těch procesů, jejichž vstupem je informace.

Mnoho hezkých příkladů lze nalézt například v oblasti dopravy ((ne)srozumitelnost dopravního značení), informačních systémů např. v nemocnici, na univerzitách apod. Zejména ve zdravotnictví, v případě, že potřebujete další vyšetření a jste objednáni na určitou dobu, pak nalezení laboratoře nebo oddělení může být „nekonečným“ příběhem. A zde si dovolím položit provokativní otázku – jak vám pomůže profiling? Na odpověď nečekám.

TIQM® systém kvality

V roce 1999 byl uveden ve známost systém kvality informací Total Information Quality Management (TIQM®) jehož autorem je celosvětově uznávaná autorita Larry P. English, president společnosti Information Impact International.

Jeho první verze byla publikována v knize Larry P. English: Improving data warehouse and business information qualitya druhá, modifikovaná verze pak v roce 2010 v publikaci Applied Information Quality.

Systém TIQM® je ucelený systém kvality aplikovaný na produkt „informace“. TIQM® vychází ze základních principů řízení kvality jako: Demingovy body kvality, Juranova trilogie, Kaizen, Gemba Kaizen, Shewhartův cyklus a další.

Systém je tvořen šesti základními procesy:

Obrázek 2: Šest základních procesů TIQM®

Původní verze z roku 1999 měla prohozeny procesy P5 a P4. Důvodem ke změně pořadí byla skutečnost, že organizace při zavádění /používání systému postupovaly sekvenčně a tak realizovaly čištění dat a pak zlepšování.

Verze 2 tedy klade důraz na to, že prvotním zájmem by mělo být zlepšení procesů, v rámci kterých vznikají nebo jsou aktualizovány informace. A teprve v následném kroku pak provést korekci /opravu dat a to pouze jednou. Důvodem k tomuto striktnímu požadavku jsou náklady na čištění dat.

Vzhledem k tomu, že systém TIQM® je de-facto standardním systémem kvality, je tedy potřebné tento systém implementovat napříč celou organizací a také vytvořit k tomu odpovídající podmínky – kulturu. Za vytvoření vhodného prostředí je pak „zodpovědný“ proces P6 - Vytvoření prostředí kvality informací, který v sobě zahrnuje nejen Demingovi body kvality, ale také principy jako „information stewardship“, který je základem tzv. information governance.

Pokud se podíváme na horizont zavedení jednotlivých procesů, pak lze říci, že procesy P1-P5 mohou být, v případě velké společnosti, zavedeny během 2 let. Avšak změna kultury a tedy prostředí v rámci organizace je proces na dobu 3-4 let.

Systém TIQM® je doplněn o IQMM™ (Information Quality Maturity Measurement), který vychází ze systému CMM (Capability Maturity Measurement) vyvinutým panem Philipem Crosbym a publikovaným v knize „Quality is Free“.

Prostřednictvím IQMM™ organizace /firma získá informace o tom, jakým způsobem jsou řízeny informace v rámci organizace a následně výstupy slouží jako vstup ke zpracování komplexní strategie informační kvality v organizaci, přičemž strategie pak obsahuje jak krátkodobé cíle, tak i dlouhodobější, u kterých se to týká postupného zavedení odpovídajícího prostředí a změny kultury organizace ve vztahu ke kvalitě informací.

V následujícím článku se budeme systému TIQM® věnovat více.

Přínosy TIQM®

Systém TIQM nabízí procesy a techniky pokrývající jednotlivé oblasti kvality: inspekce, náklady, monitoring, zlepšování, prostředí. Jedním z nejdůležitějších procesů, je proces P3 – Stanovení nákladů souvisejících s nekvalitními informacemi a identifikace rizik. Díky tomuto procesu je do prostředí organizace zaveden systém monitorování a vyhodnocování dopadu nekvalitních informací. A navíc, v případě, že jsou korektně aplikovány principy kvality informací, tak systém slouží k sledování přínosů implementovaných preventivních opatření.

Tedy, na rozdíl od jiných metodik či doporučovaných postupů, systém TIQM® vytváří pevnou vazbu mezi procesy organizace, informacemi a tzv. COQ systém (systém sledování nákladů kvality).

Pokud organizace tento systém používá, pak má plnou kontrolu nejen nad náklady (inspekce, korekce), ale též investicemi do preventivních opatření a hodnocení jejích dopadů, tj. redukce chybových nákladů ať interních, tak i externích.

Shrnutí

Existuje celá řada důvodů, opírajících se o standardní systémy kvality, proč přístupy kvality dat založených na masivním zavedení procesů inspekce (data profilingu) a oprav a korekcí (data cleansing) nevedou k pozitivním výsledkům. Naopak, podporují narůstající rezistenci k problematice kvality dat a následně i kvality informací.

Důvodem k tomuto stavu je skutečnost, že nejsou plně respektovány základní principy řízení kvality.

Změnit postoj managementu a přístupu k této problematice bude zásadní, a dlouhodobější proces. Pokud organizace chtějí realizovat úspory, snížení nákladů, pak budou muset jít minimálně ruku v ruku BPI (Business Proces Improvement), TIQM®, CMM.

Je tedy na čase se přestat věnovat neefektivní kvalitě dat a zaměřit se na kvalitu informací, jenž je systémem, skutečně zaměřující se na měřitelné a sledovatelné přínosy organizaci.

Komentáře ke článku

Stránka byla naposledy aktualizována dne 4.5.2015
Powered by HOLOPAGE
©2011 - 2015 D. Pejčoch