» 【第16号】Data Quality 97 紀行(2/2)

株式会社データ総研 データ総研のオンサイト教育
製品案内 DMBOK ITコンサルティングサービス ITコンサルティング事例 紹介セミナー 教育コース 技術情報 DRIブログ 会社概要
技術情報
【第16号】Data Quality 97 紀行(2/2)

DRI通信16号 「Data Quality 97 紀行(2/2)」    1998.1.1
皆様あけましておめでとうございます。景気回復ムードの昨年正月から、たった
一年でなんと様変りするのでしょうか。激動の20世紀末を実感する1年でした
が、今年も何が起きるのか。しかし命あるかぎり一日一日を充実させるべく、元
気を出して生きていきましょう。
さて今月は昨年12月からの続きのConference 報告を送ります。かなり長文です
が、軽い読み物になっています。お気軽に読んで見てください。さきにご感想ご
意見を下さった方々ありがとうございました。書くほうの張り合いにもなりま
す。ROMの方々も、どうぞ遠慮なくなんなりとお送りください。


(これまでのあらすじ)
さる9月29日〜10月1日に、米国はダラスにて開催された、Data Quality 97 に参
加してきました。Data Quality 97 は、データベースにおけるデータ値の品質に
焦点を当てた、チュートリアル/カンファレンス/エキシビジョンです。参加者
にむけた概論の講義、最新動向の報告、これらを支援するツールの展示が行われ
ていました。
前号では、座長のLarry English氏の2セッションを含む、4つのセッションをご
紹介しました。Data Quality とは何であるのか、これらにどう立ち向かおうとし
ているのか、という話を聞きながら、Data Quality への熱気、あるいはプラグマ
ティストの力強さを感じる前半でした。
後半は、「データモデリング」を強調しているガイガー氏、「ビジネスルール」
を強調しているオニール女史などの発表が楽しみです。それでは、会場におりて
ゆきましょう!
(ここから、前号のつづき)
2.5. 発表 「データウェアハウスにおけるデータ統合の品質」 ジョナサンガ
イガー(Conference “Data Integration Quality in the Data Warehouse”
Jonathan Geiger)
[要旨]
・データウェアハウスに、ビジネスデータモデルが不可欠である
・「ビジネスデータモデルは、欲しいデータがどこにあるか教えてくれる」
・ビジネスデータモデルをもちいたデータ統合の考え方と手順
[寸評]
・低背ながら、迫力ある存在。太く、自信に満ちた声。たいへん印象的。
・要を得たメリハリのあるプレゼン。ウィットに富む。
・ばりばりのデータモデル屋といった印象。
・最近、かのZachmanと本を出した。
・DWHに対する考え方は、驚くほどデータ総研に近い。ビックリ。
・データクオリティ問題の病原を、たいへん的確に捉えている。
・理論解説が主で、具体事例がすくなかった。
・★★★★★
2.6. 発表 「ビジネスルールとデータウェアハウス」 ボニー オニール 
(Conference “Business Rule and the Data Warehouse” Bonnie O’Neil)
[要旨]
・データ品質の問題のかなりの部分は、ビジネスルールの品質に起因する
・「どんなに、ビジネスルールが標準化されていないか、知っていますか?」
・ビジネスルールの整理なしに、DWHの成功はありえない
[寸評]
・聴衆を巻き込みながら、ノリにノって話す、エネルギッシュな女性。
・日常言語ベースのビジネスルールリポジトリの発想は面白い。
・ビジネスルールが標準化されない限りデータは汚れる、の指摘は秀逸。
・理屈は明快でよろしい。しかし実践事例が聞こえてこない。
・★★★★
2.7. 発表 「全社規模でのデータ・クオリティ管理」 チバ ソルタニ 
(Conference “Enterprise-Wide Data Quality Management” Tiba Soltani)
[要旨]
・NASD(米国証券取引の自己調節組織)でのデータ品質管理の成功事例紹介。
・きわめて信頼性の高いデータが求められる。
・情報ソース極めて多彩。ユーザ数膨大。(情報ニーズは安定的。)
・どんな体制を作って、どのようにすすめたか説明。
・「方法もツールも難度は低いが、地味で粘り強さが不可欠」
[寸評]
・小柄で声の小さい女性。着実な感じだが、華はない。
・取り込んだデータの変換方法が主題。
・元データの標準化は、はなから考えていない。
・折角の成功事例なのに、定量的効果、数字がなく、リアリティに欠けた。
・★★
2.8. 発表 「メタデータの品質:データ資源の善し悪しをみわける水準」 ミ
シェル ブラケット (Conference “Metadata Quality: Criteria For a Good
Data Resource” Michael Brackett)
[要旨]
・データの品質を計る観点を多数紹介
[寸評]
・文字多すぎる。話しも速すぎた。
・ひたすら列挙。メリハリなし。
・話しが平板。結局何が言いたいのかわからなかった。
・★
2.9. 発表 「データ・クオリティ改善業務をどう立ち上げるか」 ダネットタ
ガー (Conference “Developing and Implementing a Data Quality
Improvement Process” Danette Taggart)
[要旨]
・HP社で、顧客情報のデータウェアハウスを構築
・その際の、データ品質改善の、成功事例報告
・データ品質改善プロジェクトを成功させる体制、ポリシーやコツを紹介
[寸評]
・ていねいに説明。好感。
・こうやると、うまくいった、が具体的で参考になる
・★★★
2.10. 基調講演 「データ・クオリティ文化を育てる」 ボーガン メリリン
(Keynote Presentation “Developing a Data Quality Culture” Vaughan
Merlyn)
[要旨]
・データ品質改善して、社内で評判があがっても、それは不十分。
・データ品質改善して、会社の業績があがること、ここに狙いをもちたい。
・それには、一歩一歩階段をのぼってゆく必要がある
[寸評]
・英国なまり。洒落た感じのしゃべりかた。
・筋が通っており美しい構成だが、具体性、迫力とかはなかった。
・★★
2.11. 展示 DB Star
[要旨]
・既存システムに蓄えられたデータ値の解析を支援するツール
・実際のレコードを取り込み、精度や冗長性などを解析する。
[寸評]
・冗長性分析は、PLAN-DBの正規化そのもので、驚いた!
・我々は、ヒアリングを根拠に正規化するが、彼等は機械にやらせる。
・サブタイプや横持ちのバイアスが少なければ、解析精度は高そう。
2.12. 展示 Trillium
[要旨]
・複数のデータソースを比較し、1つのファイルに統合するツール
・類似コードの統合もやってのける
[寸評]
・とにかく1つにしてしまう、らしい。
・こうやってバリバリ統合して、大丈夫なんでしょうか。ちょっと不安。
2.13. 展示 Prizm
[要旨]
・データ品質の監査を支援するツール
・どのような監査をするか、というルールを定義する
・あとはデータ取り込みのジョブのたび、自動的にチェックする
[寸評]
・参考資料すくなく、上記のこと以上は、よくわからなかった
3. 後半の印象
さて、これで私の見聞したData Quality 97 のすべてをご紹介したことになりま
す。あとはひとフロあびて、明日の帰国に備えるか、というところですが、ホッ
トなところで、後半印象的だったところをいくつか、お話してみたいと思いま
す。
『データのリバースには、データモデルが有効』
ジョナサンガイガー氏の発表のテーマがこれでした。まさに的を射た、嬉しく
なってしまう発表でした。Zachman ダイアグラムをベースにしたメタモデルのた
め、ややモデルのレイアが4階層(Business model, System Model, Tech
Model,O-O-C model)と多いのが気になりしたが。
『ビジネスサイドでの標準化が必要』
ボニーオニール女史の発表のテーマがこれでした。これまた、的を射た、嬉しく
なってしまう発表でした。ただ、カンファレンス全体からみて、こういった発表\nが少なく、むしろ、データクレンジングやデータ品質監査の発表が多いのは、気
になります。「データの品質」それ自体がなんとかなればよい、という話なの
か、「それを生み出している原因系」にメスをいれてゆけるのか。データクオリ
ティの運動が歴史的に意義あるものになるかどうかは、このあたりにかかってい
そうです。
『パワフルなツール』
驚きました。容赦なくクレンジングしてしまいます。すごいなーと感心する反
面、使い方に要注意だな、とも思いました。クレンジングというと、聞こえはよ
いですが、当座しのぎで、のべつまくなしに、あちこちで勝手にクレンジングさ
れないよう、気をつける必要があります。つまり、全社的な視点から「きれいな
データ」のガイドラインを設け、クレンジングは常にこれに近付けるようにすべ
きです。さもないと、クレンジングのたびに、また新たな不整合が生まれてしま
います。
『データ標準化せよ、がだめなら、データの品質上げたいでしょ?』
データ標準化は至高の策ですが、それだけに、プラグマティストにはウケが悪い
ところが否めません。押してもだめなら、引いてみる。データの品質をあげま
しょうよ、というところから入って、いずれは「データ標準化」しないといけな
いことに気付く、というシナリオは、いかがでしょう。DOA導入の新しいシナリオ
にならないでしょうか?
4. 全体的な感想
『データウェアハウスは「理想」、データクオリティは「現実」』
前号冒頭でも触れましたが、データウェアハウスのインパクトは、(A)孤島シ
ステムの統合と、(B)データのマルチ活用とにあるわけです。そして、これを
実現するためのハードウェア/ソフトウェアは、これだけ技術革新した昨今、な
かなかに素晴らしい商品が提供されているようです。それならもう何の問題もな
いのか、というと、そうはいかない。というのも、データウェアハウスに命のコ
ンテンツを提供しようというレガシーシステムの方は、そもそも(a)個別業務
最適に、(b)固定入出力専用に、つくられてきているわけです。つまり(A)
や(B)にはムリがある。どこに最もムリがあらわれるか、というと、データの
値。すなわち、個別業務最適に設計されたデータ値を全社的に使うのにはムリが
ありますし、固定入出力専用にカスタマイズされたデータ値をマルチ活用するの
にはムリがあります。このムリが、データクオリティというキーワードで語られ
ているのではないでしょうか。データウェアハウスは「理想」、データクオリ
ティは「現実」、と呼んでみると、構図がくっきりした感じです。
『データのマルチ活用には、データ項目の意味のリバースが不可欠』
なるべくフィールドを増設せずに、ともかく新たにリクエストされた帳票を打ち
出す、というメンテナンスが続くと、データ項目の意味が汚れてゆきます。1つ
のフィールドに複数の意味のデータが同居(いわゆる 観点混在(many facts
inone place))したり、1つの意味のデータがあちこちに分散(いわゆる冗長性
(one fact in many places))してゆき、ついには、ここに何が書いているかわ
からない、何がどこに書いてあるかわからない、スパゲッティ状態になってゆく
わけです。これが、データのマルチ活用を妨げているわけです。データ項目の意
味をリバースしてやる(one fact in one place にする)ことが不可欠です。
『孤島システムの統合には、ビジネスデータの標準化が不可欠』
これまでは、対象業務の迅速な機械化が至高のミッションであったため、島シス
テム間でのデータ標準化は、ほとんど顧みられることがありませんでした。この
結果生じてしまった業務間でのデータのばらつきは、多くのDWHベンダが口にして
いるよりも、ずっと深刻であることに、早く気がつかねばなりません。共用する
ためには標準化は不可欠なのです。データの形式、データの意味について、わが
社としてはこれを標準にしてゆこう、という意志決定が、データを流通させるた
めには、ぜひとも必要であると考えます。
わが国では、データウェアハウスへの試みは、これからますます加速するものと
思われます。この理想に立ちはだかる現実は何か、これを克服するために、私達
にできるサービスは何か。Data Quality 97への参加は、こういったことをじっく
り考える、よい機会となりました。
                   文責:椿高明(ttsubaki@drinet.co.jp)