Data Management Body of Knowledge(DMBOK)は、データ品質(DQ)を”データが消費に適合し、データ消費者のニーズを満たすことを保証するために、データに品質管理技術を適用する活動の計画、実施、管理”と定義している。”
データ品質に関する期待は常に言葉で表現され、知られているわけではないので、継続的な議論が必要です。 データの品質は、コンテキストとデータ消費者の要件に依存します。
データ品質次元の短いリストは次のとおりです:
- 正確性
- 完全性
- 一貫性
- 整合性
- 合理性
- 適時性
- 一意性/重複排除
- 妥当性
- アクセシビリティ
データ品質の他の定義は次のとおりです:
- “目的のための適合。 作成者、ユーザー、管理者の要件を満たしています。”(Dr.Peter Aiken,adapted from Martin Eppler)
- “企業全体で有用なデータの正確性、一貫性、完全性への依存。”(Michelle Knight)
- 解析と標準化、一般化された”クレンジング”、マッチング、プロファイリング、モニタリング、エンリッチメントに使用されるツールとプロセス(Gartner)
- Strong-Wangフレームワーク:(Wang、およびStrong、MITおよびDAMA DMBOK)
- 本質的なDQ:
- 正確さ
- 客観性
- 信憑性
- 評判
- コンテキストDQ:
- 付加価値
- 関連性
- 完全性
- 適切なデータ量
- 代表的なDQ:
- 解釈可能性
- 理解の容易さ
- 表現の一貫性
- 簡潔な表現
- アクセシビリティDq:
- アクセシビリティ
- アクセスセキュリティ
- 本質的なDQ:
データ品質のいくつかの用途は次のとおりです:
- 組織データの価値とそれを使用する機会を増やす。
- 低品質のデータに関連するリスクとコストの削減。
- 組織の効率性と生産性を向上させます。
- 組織の評判を保護し、強化する。
- データプロファイリング。
- データ標準化。
- データ監視。
- データクレンジング。
写真提供:Rawpixel.com/.com