Data Quality CZ - portál věnující se tématu kvalitních dat

Domovská stránka

Aktuální články na portálu

O portálu Data Quality CZ

Vážený návštěvníku, vítejte na neziskovém portálu Data Quality CZ. Portál vznikl původně jako součást disertační práce Davida Pejčocha s cílem komplexně zmapovat téma datové kvality. Naleznete zde řadu volně dostupných tutoriálů či odkazů na další odborné zdroje (písemné prameny, elektronické publikace, články na jiných webech). Pojmy související s problematikou datové kvality jsou definovány ve slovníku. Schématické znázornění vazeb mezi souvisejícími tématy poskytuje DQ Topic Mapa vytvořená pomocí nástroje FreePlan. Na portálu jsou pravidelně jednou za měsíc publikovány odborné články glosující aktuální vývoj v oblasti řízení dat. Nepravidelně jsou zde též publikovány výsledky výzkumu členů komunity spolupracující na vývoji portálu. Registrovaný uživatel může k jednotlivým článkům přidávat komentáře a recenze. Na portálu rovněž naleznete popis většiny používaných nástrojů, které lze v praxi použít pro řízení datové kvality. V případě jakýchkoliv námětů vedoucích k potenciálnímu zvýšení kvality informací publikovaných na tomto portálu nás prosím neváhejte kontaktovat. V případě Vašeho zájmu o spolupráci na tvorbě obsahu portálu Data Quality CZ prosím následujte pokyny po autory.

Úvod do problematiky

Problematika kvality dat (angl. Data Quality) a na ní navazující problematika kvality informací (angl. Information Quality) se zejména s ohledem na enormní nárůst objemu zpracovávaných dat ve firmách dostala v posledním desetiletí do popředí zájmu. Firmy nejprve pochopily, že data pro ně v informační době znamenají velice cenné aktivum, účinnou zbraň v boji o udržení a získání nových zákazníků. S rostoucím uvědoměním si důležitosti vlastních dat se role kvality dat posunula od přednosti k nutnosti. Ten, kdo díky duplicitním záznamům v klientských datech frustruje své zákazníky opakovaným oslovováním v marketingových kampaních o tyto zákazníky dříve či později přijde. Ten, kdo zasílá svým zákazníkům permanentně chybně vyplněné faktury, dopadne stejně.

V další fázi firmy začaly chápat, že retroaktivní přístup k datové kvalitě pomocí ad-hoc prováděných akcí „čistá data“ se stává neúčinným, pokud nemá odraz ve změně podnikových procesů, v rámci nichž tyto nečistoty vznikají. Současně si firmy začaly uvědomovat nutnost integrace čistých dat v rámci různých datových zdrojů. Začalo se mluvit o jediném pohledu na zákazníka (resp. produkt) a skloňovat pojmy jako je Master Data Management (MDM) či Customer Data Integration (CDI) .

Pokud bychom si položili otázku, co přesně se v tomto případě rozumí pod abstraktním pojmem „kvalita“, dospěli bychom k závěru, že se jedná o míru naplnění určitých vlastností, které od dat očekáváme. Jako příklad těchto vlastností lze uvést správnost dat (jak po syntaktické, tak po semantické stránce), důvěryhodnost, unikátnost nebo též jejich úplnost, kterou lze zjednodušeně vyjádřit jako míru vyplněnosti datových atributů. Již na první pohled je zřejmé, že část těchto vlastností dat je numericky měřitelná (hovoříme o tzv. objektivních metrikách) a část z těchto vlastností představuje metriky subjektivní, které lze jen obtížně numericky kvantifikovat.

Osobnosti zabývající se problematikou datové kvality

  • Larry English - guru kvality informací
  • Jil Dyché - první dáma Data Governance
  • Evan Levy - spoluzakladatel Baseline Consulting, autor řady publikací
  • David Loshin - autor řady publikací pojednávajících o dopadu nekvalitních dat do byznysu
  • prof. Richard Wang - vůdčí postava MIT Total Data Quality Management program
  • prof. Carlo Batini - Università degli Studi di Milano-Bicocca
  • Thomas C. Redman, Ph.D. - prezident Navesink Consulting Group

Odborná sdružení a organizace zabývající se problematikou datové kvality

Aktuality

Talend v kvadrantu vizionářů pro oblast Data Integration Tools
2014-09-14 06:53:27
Řešení společnosti Talend pro datovou integraci se v rámci Magic Quadrants publikovaných společností Gartner pro rok 2014 umístilo v kvadrantu vizionářů a ocitlo se téměř na hranici kvadrantu leaderů. Report z července 2014 je k dispozici na stránkách Talend.com. ...
Aktualizace CDM
2014-09-14 06:43:29
V rámci sekce Výzkum byl nově publikován seznam referenčních zdrojů ke kanonickému datovému modelu pro vertikálu Insurance. ...
Nový release nástroje Data Cleaner
2014-07-06 11:04:23
Společnost Human Inference na webu datacleaner.org oznámila release 3.6.1 nástroje Data Cleaner. Release opravuje některé známé chyby předchozí verze a poskytuje i některé novinky (např. triggering mode pro scheduler, rušení úloh běžících na clusteru, apod.) ...
Big Data Governance podruhé
2013-09-22 05:56:10
Tématu Big Data Governance se rovněž věnuje nedávno publikovaná kniha Sunila Soarese. Přelomovou myšlenkou této knihy je chápání Big Data Governance pouze jako součásti globální Data Governance iniciativy. Do určité míry tak demistifikuje fluidum, které si Big Data okolo sebe vytvořila a otevírá otázku, zda téma Big Data Quality není pouze buzzword. ...
Další aktuality
 
.
Stránka byla naposledy aktualizována dne 4.5.2015
Powered by HOLOPAGE
©2011 - 2021 D. Pejčoch