» 「正しい」の意味

株式会社データ総研 データ総研のオンサイト教育
製品案内 DMBOK ITコンサルティングサービス ITコンサルティング事例 紹介セミナー 教育コース 技術情報 DRIブログ 会社概要
「正しい」の意味

DAMA-DMBOKに10のデータマネジメント機能が紹介されています。
今日は、その中の1つデータクオリティマネジメントに関するお話しです。

データクオリティマネジメントとは、端的に言えば、使いたいときに使いたい正しさであるように、データを登録・管理することです。データの精度・鮮度の維持と言い換えても良いでしょう。

ところで、データや情報に関する品質管理が興味の対象となったのはいつ頃からでしょうか?1997年よりも前であることは確かだと思います。というのも、1997年に弊社社員がアメリカで開催された「Data Quality 97」カンファレンスに参加しており、そのころはすでにデータクオリティマネジメントに関して、非常に熱気のある議論がされていたためです。
(以下、ご参考までにカンファレンスの参加報告です)

DRI通信第15号 Data Quality 97 報告(1/2)

1999年にラリー・イングリッシュ氏著作の「Improveing Data Warehouse and Business Information Quality」が出版され、翌年「高品質データウェアハウス戦略」という名で同書の邦訳が出版されました。また、ラリー・イングリッシュ氏が来日して同書の内容で講演しました。

このとき、イングリッシュ氏から日本のデータマネジメントの実情が知りたいと言われ、弊社の顧客企業につれていきました。その中のある企業では、データモデルの作成、データ定義の維持管理が全社的に標準化されており、「日本は非常に進んでいる。さすがに品質管理の国だ」と感心されたことを覚えています。

さて、本題に戻ります。
当時データクオリティマネジメントに関する動向を調査する場合、日本では情報がとれないため、ほとんど海外の雑誌やペーパーが中心だったのですが、「正しい」と日本語訳したくなる英単語が同じページに現れ、困ったことがあります。
correct、Accuracy、Validityなどです。

「誤りのない、正しい」と日本語訳することはできても、英語のニュアンスが理解できないため、これらの違いがわかりませんでした。

現在は、DAMA-DMBOKのおかげで、少しは正しさの違いが理解できるようになりました。DAMA-DMBOKに記述されている「データクオリティの評価軸」をここでいくつか紹介します。

Accuracy:データが表そうとしている「現実の」実体がどれくらい正しく示されているかの度合
Validity:値のドメイン(値域)と矛盾しないこと
DAMA-DMBOKにcorrectの記述は無いのですが、ほかに次のような正しさも紹介されています。
Completeness:データセット内である値が指定された値で入っていること、必須属性など。
Consistency:あるデータセット内のデータの値が、他のデータセットの値と一致していること。

正しさを表す単語の数が日本語より多いということは、正しさに関するより詳細な概念が英語を話す人達には存在するということでしょう。日本は品質管理の国かもしれませんが、データに関する品質管理については、遅れているのかもしれません。

データ総研 コンサルタント