Az adatminőség-pokol 9 köre – a Föld
Ki itt belépsz, hagyj fel minden reménnyel

Ez a felirat fogadta Dante Poklának bejáratát. A vétkek súlya szerint helyezkednek el a Pokol egyre mélyebb köreiben a bűnösök aszerint, hogy milyen mértékben sértették meg isteni és a természeti törvényeket.
Ne félj, nem fogunk egyből a pokolba leszállni, ma még csak a Földön fogjuk elkövetni a bűnöket az adatminőség földi világában, hogy aztán megbűnhődjünk a pokol egyre mélyebb bugyraiban.
Az ok, hogy a pokolban kötünk ki: csak az Egyesült Államokban évente több, mint 600 millárd dollárba kerül a gyenge adatminoség.
Vegyünk csak egy példát. Aki feliratkozik a migration.hu oldalon, hogy letöltse a tanulmányt, az beírhat egy családi nevet és keresztnevet. Mondjuk beírja így, mert siet:
Családi név: Kiss
Keresztnév: Gáza
A levelezőrendszer ilyen kezdetű levelet fog küldeni első alkalommal, ha nem javítom ki kézzel:
Kedves Gáza!
…
Gáz, nem? Hibás a felhasználó, mert o írta be így a nevét, hibás vagyok én is, mert nem nézek meg minden egyes nevet, aki megadja az email címet. Mondjuk nekem még nincs százezres nagyságrendű adatbázisom az érdeklődőkbol, de mit csináljak akkor, ha naponta jön 2000 látogató az oldalra, és ebből 400 megadja a nevét és email címét?
Manapság egyre inkább internacionalizálódunk. Ennek többek között olyan hátránya is van, hogy a vállalatok többnyelvű szoftvert használnak – mert esetleg nem minden Gizike tud angolul – és vannak szavak, esetleg földrajzi nevek, amelyek máshogy tárolódnak az adatbázisban. Például a holland Hága városa 52-féleképpen írható le: Den Haag, Den Haague, stb. El tudod képzelni, hogy mi történik akkor, ha például a vállalat piackutatást szeretne folytatni ebben a városban, és címeket gyűjt az adatbázisból?
Így láthatod, hogy milyen könnyen keletkeznek a bűnök, amelyeket az adatminőség poklába vezetnek. A következő bejegyzésekben végigmegyünk a pokol mind a kilenc körén.

english
magyar
