Data Governance, pojem jednimi vynášený do nebes, druhými zatracovaný. Potřebujeme ho vlastně? Jaký je rozdíl mezi Data Governance a Data Management? Neznamená to nakonec to samé? Není Data Governance jen dalším buzzwordem, aby bylo o čem psát a co monetarizovat? Cílem tohoto článku je kriticky zhodnotit dosavadní přístupy k Data Governance a poukázat na nutnost univerzálního přístupu řízení ke všem datům, s nimiž firma přichází a potenciálně může přicházet do styku.
V publikaci (Dyché & Levy, 2006) se lze v souvislosti s řízením dat setkat s pojmem Hierarchie řízení. Jejich přístup uvažuje celkem pět různých úrovní řízení a přiřazuje je k běžně zmiňované operativní, taktické a strategické úrovni řízení (lokální datovou kvalitu, globální datovou kvalitu, Master Data Management, Data Governance a IT Governance). Na strategické úrovni zmiňuje Data Governance, pojem často zmiňovaný spíše v kontextu se „správou“ než řízením. Jaký je však skutečný rozdíl mezi správou a řízením? Data Management je většinou prezentován jako každodenní vykonávání politik stanovených na úrovni Data Governance. Tedy jako operativní řízení, možná taktické řízení dat. Kam se ale podělo strategické řízení dat? Proč mu najednou říkáme „správa“?
Důvodem může být v poměrně nedávné době vzrostlá oblíbenost konceptu IT Governance, který zdůrazňuje nutnost úzkého provázání IT strategie na cíle firmy a hodnotu plynoucí z investic do IT při současném řízení možných rizik těchto investic. Pro lepší pochopení tohoto konceptu je nutné popsat události, které jeho vzniku předcházely. Období několika posledních dekád bylo bezesporu spjaté se značnými investicemi do IT. S těmito investicemi narůstala moc CIO (Chief Information Officer), v jehož kompetenci často nákup těchto prostředků byl. Tato rostoucí moc zvyšovala nelibost a obavy zbytku vedení firem a akcionářů. V rámci firmy v podstatě začala v mnoha odvětvích vyrůstat vlastní říše vedená CIO, opředená fluidem technologií, kterým ostatní většinou nerozuměli. Pouze věděli, že je (většinou) potřebují. Do této napjaté atmosfery vydává Nicolas Carr svou legendární knihu bagatelizující přínosy IT ke konkurenční výhodě firem. Výsledkem byl nový trend odebírající dosud privilegované postavení ředitelům informatiky. Ředitel informatiky není nadále tím, kdo rozhoduje neomezeně o infrastruktuře a investicích do jejího rozvoje. Tento přísup nelze než označit za pragmatický a pochopitelný.
Data představují jedno z klíčových korporátních aktiv „spravovaných“ v rámci Governance aktivit. V duchu hierarchie znalostí, publikované prof. Zeleným, zasazením dat do kontextu získáváme informaci, resp. informační produkt, jehož dodávka je klíčovým posláním celé informatiky. Konec konců, informace dala celému oboru název. Je tedy logické, že koncept IT Governance začal prorůstat do oblasti řízení dat a rovněž charakter a úroveň zpracovávaných dat by měl být sladěn s cíli firmy. Proč ale vznikl samostatný pojem Data Governance již tak zřejmé není. Význam Data Governance na jednu stranu reflektuje skutečnost, že data nejsou předmětem vlastnictví ředitele informatiky, ale celé společnosti. To samo o sobě dává smysl. Jak je to však s dalšími aktivy, se kterými informatika pracuje? Proč nevznikly současně pojmy jako je Human Resources Governance, Hardware Governance a Software Governance? Jsou snad lidské zdroje pro firmu méně důležité než data?
Podle (Dyché & Levy, 2006) Data Governance představuje organizační rámec pro vytvoření strategie, cílů a politik pro korporátní data. Z jejich přístupu je cítit důležitost kooperace jednotlivých prvků organizační struktury při správě dat. Nutnost této kooperace napříč firmou je zřejmá. V čem se však liší od nutnosti kooperace při správě jiných korporátních aktiv (např. lidských zdrojů)? (Berson & Dubov, 2007) za Data Governance považují proces zaměřený na řízení kvality, konzistentnosti, užitečnosti, bezpečnosti, dostupnosti a vlastnictví informací. V dané situaci může být poněkud zarážející, že autoři používají při definici pojmu Data Governance pojem informace, nicméně to pouze reflektuje skutečnost, že od určité úrovně řízení pojmy data a informace splývají. Mnohem více zarážející je skutečnost, že minimálně řízení konzistentnosti, bezpečnosti a dostupnosti dat / informací je často zmiňováno i na úrovni Data Quality Management (tedy řízení dat), na taktické úrovni v podobě definice mechanismů a na operativní úrovni v podobě jejich implementace a monitoringu.
Hlavním cílem Data Governance je podle (Berson & Dubov, 2007) vytvoření rámce zaměřeného na kontinuální měření a zlepšování kvality dat. Tento rámec obsahuje organizační struktury, politiky, procesy, procedury, řízení metadat a jejich administraci a v neposlední řadě vytváření byznys pravidel. Z uvedeného přistupu je patrné, že se jedná o cosi nad taktickou a operativní úrovní řízení dat, tedy strategickou úroveň řízení. Proč tomu ale říkat Governance?
(Ladley, 2012) ve snaze definovat tento pojem odkazuje na přístup DAMA, která považuje Data Governance za „organizaci a implementaci politik, procedur, struktur, rolí a odpovědností, které vymezují a prosazují pravidla účasti, rozhodovací práva a odpovědnosti pro efektivní řízení informačních aktiv“. Zdůrazňuje oddělení Governance od řízení informací ve smyslu kontroly, monitoringu a dohlížení na aplikaci standardů a pravidel definovaných v rámci Governance. Informační management a Data Governance podle (Ladley, 2012) tvoří dohromady komponenty EIM (Enterprise Information Management). Hleďme, další buzzword. O to pozoruhodnější, že implikuje rovnici Management + Governance = Management. Zdá se, že samotný Ladley nemá jasno, zda Governance ve smyslu správy postavit nad řízení.
Výsledkem Data Governance iniciativy jsou podle (Ladley, 2012) principy (ve smyslu základních norem, doktrín a předpokladů) a politiky (ve smyslu pravidel nebo kodexu jednání). Pod kodexem jednání rozumí (Ladley, 2012) obecně akceptovatelné principy jako jsou např. reálná hodnota dat, riziko spojené s daty, pravidelný audit dat, odpovědnost za data a obsahová aktiva, nutnost obezřetnosti (due dilligence) a kvalita dat. Přes toto poměrně srozumitelné vymezení pojmu Data Governance Per Zurich (leadership at MDM SUMMIT Europe) jej přirovnává k chápání sexu mezi teenagery (nevím, do jaké míry má povědomí o současné mládeži), ve smyslu něčeho, o čem nikdo nic pořádně neví, ale všichni si myslí, že to musí být něco úžastného. Na rozdíl od Per Zuricha jsem si naprosto vědom, co je součástí Data Governance, pouze nechápu, proč mu neříkáme strategická úroveň řízení dat a neakcentujeme pouze obecnou důležitost vazby strategického řízení jakéhokoliv aktiva v souladu s celofiremní strategií.
Data Governance iniciativa má podle (Ladley, 2012) též dopad do organizační struktury podniku (definice formálních rolí, zapojení funkčních rolí napříč podnikem) a spektra sledovaných metrik (profilace, byznys hodnota, efektivnost správy, nárůst v oblasti zralosti informačního managementu). Dopad do organizační struktury podniku má však prakticky jakákoliv velká změna a v kontextu zavádění Performance Managementu představuje spektrum metrik sledovaných z pohledu Data Governance pouze jejich malou část.
Praktické zavádění principů Data Governance představuje kapitolu samu o sobě. Přestože např. (Ladley, 2012) preferuje opatrnou evoluci se zapojením iterativního přístupu před metodou velkého třesku, v praxi se můžeme často setkat s pravým opakem. Přitom postupné zavádění jako doporučovaný postup prakticky čehokoliv zmiňuje snad každá učebnice informatiky. Monstrózní neúspěchy implementací takových programů pak dláždí cestu k zatracení jinak poměrně rozumné iniciativě (ať už ji nazýváme jakkoliv). Na vině v takovém případě není samotné Data Governance, ale diletantství jeho implementátorů nebo snaha dodavatele „zaháčkovat“ se na dlohodobém projektu.
Oblíbeným pojmem v souvislosti s Data Governance je vlastnictví, resp. stewardship dat. Přestože tyto pojmy mohou svádět k domněnce, že jejich význam je prakticky totožný, opak je pravdou. Pojem vlastnictví je přitom v praxi chápán velice různorodě. Uveďme několik příkladů. 1) Vázaný pojišťovací zprostředkovatel „vlastní“ pojistný kmen (soubor pojistníků). Pokud se rozhodne, může s celým kmenem přejít k jiné pojišťovně. Kdo je v tomto případě vlastníkem dat navázaných na pojistný kmen? Jisté je pouze, že pojišťovna je jejich dočasným správcem. 2) Pracovník odělení, který má na starost prodejce z daného regionu se rozhodne předat data externí agentuře k oslovení v rámci kampaně. Zodpovědný analytik mu odmítne data předat, dokud nebude mít od právního oddělení potvrzené, že korporátní pravidla toto umožňují. Obchodník argumentuje svým domělým vlastnictvím příslušného portfolia a souvisejících dat.
Ale i samotné vymezení pojmu správce je dosti vágní. Zatímco (English, 1999) tuto odpovědnost přenáší na všechny osoby, které daná data používají, (Dyché & Levy, 2006) nebo (Berson & Dubov, 2007) hovoří o konkrétních rolích v rámci podnikové organizační struktury. Kromě stevarda uvažují též byznys experta pro danou předmětnou oblast, byznys analytika, datového analytika, administrátora dat, administrátora metadat, manažera bezpečnosti dat, manažera kvality dat, apod. Musím se přiznat, že osobně jsem se během své dosavadní profesní dráhy dosud nesetkal s člověkem, který by měl explicitně vymezené pracovní zařazení na pozici datového stevarda. Na tuto skutečnost jako na poměrně běžný jev konec konců poukazují též (Dyché & Levy, 2006), když zmiňují, že v mnoha firmách je role stevardů fakticky vykonávána, aniž by tato skutečnost byla nějak formalizována. Nepředstavuje potom Data Governance uměle vytvořený konstrukt, když jedna z jejích klíčových oblastí je de facto vykonávána, anebo v odpovědnosti všech pracovníků daného subjektu?
V poslední době jsem v souvislosti s Big Data zaregistroval enormní nárůst publikací na téma Big Data Governance. Jestliže Data Governance samotné je mnohými autory považováno za pouhý buzzword, v případě Big Data Governance se tohoto dojmu lze již velmi obtížně zbavit. Vždyť samotná definice velkých dat, jako takových, která „nelze nebo je neefektivní zpracovávat konvenčními prostředky“ (ve smyslu RDBMS), je značně nepřesná (a rozhodně pomíjivá). Již v současné době představují technologie, s jejichž pomocí jsou velká data zpracovávána v oblastech, jako je online byznys, prostředky konvenční. Pojem velká data nás nejspíš jako jiné buzzwordy časem neopustí, ale jeho význam se bude spíše posouvat. To co byla velká data před pár lety, budou malá data budoucnosti. Pojem Big Data Governance je však naprostý nesmysl. Pokud mají existovat principy správy, je nutné je aplikovat napříč celým univerzem dat, se kterými firma přichází do styku bez ohledu na konkrétní technologické prostředky, na nichž jsou tato data zpracovávána. Když už připustíme oprávněnost pojmu Data Governance, existuje pouze jedno Governance. Naštěstí řada autorů jako je např. Sunil Soares jsou si toho vědomi a tak i v rámci publikací, které nesou název Big Data Governance poukazují na nutnost komplexní správy.
Dnešní doba je bezpochyby velmi příznivá vzniku různých buzzwordů. Je až pozoruhodné, jakým množstvím pojmů a definic oplývá informatika, jako poměrně mladá věda ve srovnání s některými staršími obory. Nedávno jsem měl možnost znovu si poslechnout jednu z her Divadla Járy Cimrmana a stejně tak jako tento legendární myslitel se pozastavoval nad nutností memorování nezapamatovatelných historických dat, táži se i já: „skutečně musíme neustále vymýšlet nové a nové pojmy, jejichž životnost je diskutabilní, a zanášet jimi mysl studentů i odborné veřejnosti“? Zatímco kdysi se soubor veškerého vědění vešel do mysli jediného pozitivisty (který poté ovšem zemřel na celkové vysílení), dnes lze ztěží obsáhnout pouhý jeden vědní obor. Ztěžujeme si na informační přesycenost, a přesto objem informací stále zvyšujeme, často uměle, hnáni diskutabilními cíli. Nedávno jsem byl přítomen obhajobě projektu disertační práce jednoho mého kolegy. Prakticky jsem zaznamenal pouze jednu výtku ze strany komise a to, že použitá terminologie spíše koresponduje s jinou katedrou jiné školy. Opravdu toto myslíme vážně? Opravdu každý musíme mít svou vlastní odlišnou terminologii pro ty samé oblasti?
Nemohu se ubránit dojmu, že pojem Data Governance a pojmy z něj odvozené, jsou tu prostě navíc. Dle mého názoru se ve své podstatě jedná o strategickou úroveň řízení dat (potažmo informatiky), které je stejně tak jako v případě ostatních klíčových aktiv nutné sladit jednak se strategickým řízením těchto aktiv, jednak se strategií celé firmy.