organ zarządzania danymi (DMBOK) definiuje jakość danych (DQ) jako „planowanie, wdrażanie i kontrolę działań, które stosują techniki zarządzania jakością do danych, w celu zapewnienia ich przydatności do spożycia i zaspokojenia potrzeb konsumentów danych.”
ponieważ oczekiwania dotyczące jakości danych nie zawsze są werbalizowane i znane, konieczna jest ciągła dyskusja. Jakość danych zależy od kontekstu i wymagań konsumenta danych.
krótka lista wymiarów jakości danych to:
- dokładność
- kompletność
- spójność
- integralność
- rozsądność
- terminowość
- wyjątkowość/deduplikacja
- Ważność
- dostępność
inne definicje jakości danych obejmują:
- „pasuje do celu. Spełnia wymagania swoich autorów, użytkowników i administratorów.”(Dr Peter Aiken, adaptacja Martina Epplera)
- „poleganie na dokładności, spójności i kompletności danych, aby były użyteczne w całym przedsiębiorstwie.”(Michelle Knight)
- narzędzia i procesy używane do analizowania i Standaryzacji, uogólnionego „oczyszczania”, dopasowywania, profilowania, monitorowania i wzbogacania (Gartner)
- Strong-Wang framework: (Wang, i Strong, MIT i DAMA DMBOK)
- wewnętrzna DQ:
- dokładność
- obiektywność
- wiarygodność
- reputacja
- kontekstowe DQ:
- Wartość dodana
- trafność
- kompletność
- odpowiednia ilość danych
- reprezentacyjne DQ:
- interpretacja
- łatwość zrozumienia
- spójność reprezentacyjna
- zwięzła reprezentacja
- dostępność DQ:
- dostępność
- Bezpieczeństwo dostępu
- wewnętrzna DQ:
kilka zastosowań jakości danych to:
- zwiększenie wartości danych organizacyjnych i możliwości ich wykorzystania.
- zmniejszenie ryzyka i kosztów związanych z niską jakością danych.
- poprawa efektywności i produktywności organizacji.
- Ochrona i wzmacnianie reputacji organizacji .
- profilowanie danych.
- standaryzacja danych.
- monitorowanie danych.
- czyszczenie danych.
Rawpixel.com/.com