Data Quality CZ - portál věnující se tématu kvalitních dat
Výzkum v oblasti řízení datové kvality
Metodika generování testovací populace
Popis záměru
Cílem je poskytnout nástroj pro umělé vygenerování populace na základě znalostí obsažených ve znalostní bázi.
Prohlášení o postupu generování testovacích dat
- Data byla uměle vygenerovaná, pokud některé údaje odpovídají reálným klientům, jedná se o náhodu;
- Data PRIVATE PARTY byla vygenerována na základě kombinace veřejně dostupných číselníků a údajů na webu Českého statistického úřadu;
- Data vzorku COMMERCIAL PARTY byla dohledána v dostupných veřejných registrech;
- Data adres byla použita z registru UIR ADR a poté uměle „znečištěna“ na základě známých defektů, které se dříve vyskytly v rámci reálných projektů, jichž jsem byl účastníkem;
- Data mobilních čísel byla uměle vygenerována na základě dostupných informací o předčíslích vyhrazených pro mobilní operátory;
- Data emailů byla uměle vygenerována na základě kombinace jména, příjmení a vybraných SLD poskytovatelů služeb typu mailbox.
Publikované výstupy
Document Tree