Vážený návštěvníku, vítejte na neziskovém portálu Data Quality CZ. Portál vznikl původně jako součást disertační práce Davida Pejčocha s cílem komplexně zmapovat téma datové kvality. Naleznete zde řadu volně dostupných tutoriálů či odkazů na další odborné zdroje (písemné prameny, elektronické publikace, články na jiných webech). Pojmy související s problematikou datové kvality jsou definovány ve slovníku. Schématické znázornění vazeb mezi souvisejícími tématy poskytuje DQ Topic Mapa vytvořená pomocí nástroje FreePlan. Na portálu jsou pravidelně jednou za měsíc publikovány odborné články glosující aktuální vývoj v oblasti řízení dat. Nepravidelně jsou zde též publikovány výsledky výzkumu členů komunity spolupracující na vývoji portálu. Registrovaný uživatel může k jednotlivým článkům přidávat komentáře a recenze. Na portálu rovněž naleznete popis většiny používaných nástrojů, které lze v praxi použít pro řízení datové kvality. V případě jakýchkoliv námětů vedoucích k potenciálnímu zvýšení kvality informací publikovaných na tomto portálu nás prosím neváhejte kontaktovat. V případě Vašeho zájmu o spolupráci na tvorbě obsahu portálu Data Quality CZ prosím následujte pokyny po autory.
Problematika kvality dat (angl. Data Quality) a na ní navazující problematika kvality informací (angl. Information Quality) se zejména s ohledem na enormní nárůst objemu zpracovávaných dat ve firmách dostala v posledním desetiletí do popředí zájmu. Firmy nejprve pochopily, že data pro ně v informační době znamenají velice cenné aktivum, účinnou zbraň v boji o udržení a získání nových zákazníků. S rostoucím uvědoměním si důležitosti vlastních dat se role kvality dat posunula od přednosti k nutnosti. Ten, kdo díky duplicitním záznamům v klientských datech frustruje své zákazníky opakovaným oslovováním v marketingových kampaních o tyto zákazníky dříve či později přijde. Ten, kdo zasílá svým zákazníkům permanentně chybně vyplněné faktury, dopadne stejně.
V další fázi firmy začaly chápat, že retroaktivní přístup k datové kvalitě pomocí ad-hoc prováděných akcí „čistá data“ se stává neúčinným, pokud nemá odraz ve změně podnikových procesů, v rámci nichž tyto nečistoty vznikají. Současně si firmy začaly uvědomovat nutnost integrace čistých dat v rámci různých datových zdrojů. Začalo se mluvit o jediném pohledu na zákazníka (resp. produkt) a skloňovat pojmy jako je Master Data Management (MDM) či Customer Data Integration (CDI) .
Pokud bychom si položili otázku, co přesně se v tomto případě rozumí pod abstraktním pojmem „kvalita“, dospěli bychom k závěru, že se jedná o míru naplnění určitých vlastností, které od dat očekáváme. Jako příklad těchto vlastností lze uvést správnost dat (jak po syntaktické, tak po semantické stránce), důvěryhodnost, unikátnost nebo též jejich úplnost, kterou lze zjednodušeně vyjádřit jako míru vyplněnosti datových atributů. Již na první pohled je zřejmé, že část těchto vlastností dat je numericky měřitelná (hovoříme o tzv. objektivních metrikách) a část z těchto vlastností představuje metriky subjektivní, které lze jen obtížně numericky kvantifikovat.