【ISO 11179とは つづき】
さて、必須の管理対象であるデータ要素はデータ項目そのものであり、値ドメインは、データ項目の定義域を規定する共通部品といえる。
値ドメインには、コード系のように取りうる値の範囲を列挙できるものと、金額や年月日のように列挙できないものに分けられる。
また、値ドメインは、桁数やデータの型まで規定することとなっている。
このようにして、一旦腹に落ちると、ISO 11179というとっつきにくい世界標準が、21世紀における車輪の再発明に似ていることが分かるだろう。
やっと、データの意味管理の手法が統一されたいま、これをベースに現実適用におけるノウハウの交換が進み、どんどん成功事例が日本で生まれて欲しいと願っている。
欧米では既に大規模な適用が始まっていて、一番有名なのが、NCI(米国がん協会)の辞書であり、そのデータ項目の定義内容を見ると、あまりにも忠実にこの手法に則っているのが分かる。
まあ、実際の定義内容を見る限り、もっと現実的なレベルでよいハズだと思うのは私だけではないだろう。
もっとも、がん対策という国家レベルの課題に対して立ち向かうには、幅広く臨床データを集め、多様な意味解析をし、層別する必要があるのだろうが。
そのためには、人知を尽くしたデータを網羅的に集め、その意味を明確に定義し、正しく分析できなければならないのだろう。
なにしろ、データ項目の定義属性がたくさんあり、維持管理が大変だろうし、そもそも品質的にも問題が起きそうだ。
因みに、政府系機関であるNCIはデータ辞書そのものを一般公開しており、自信の程が伺える。
一方、米国のAllstate生命保険会社は、非常に現実的な範囲で適用しており、最も効果を挙げているといえる。
その内容は、レガシーシステムのDBカラムを中心にコード系の値ドメインの管理を行っている。
約3万項目に対して6千個の値ドメインを切り出し、例えば、州コードや性別コードだけでも10種類以上の値ドメインを定義したとある。
性別コードを例にとると、メインフレーム系でも、キャラクタとニューメリックの違い、値域の違い(例えば、1:Male/2:Female、1:Male/2:Female/3:Other)などにより、別ドメインとしている。
その結果、DWHなどの多くの利用者が一元的にデータの意味などを利用でき、情報の品質向上と利用の効率化の両面で効果を出しているようだ。
値ドメインは、このように大規模・複雑・未整備な既存システムに対して、直接適用できるのが一番のメリットである。
既存システムのデータ標準化を、実システム(プログラムやテーブル定義)を一切変更することなく行える。
私自身、データ管理のmustな部分は、コード系値ドメインの一元管理だと、この20年あまり実践体験をもとに訴え続けている。
値ドメインを定義・紐付けし、現状のありのままのデータを一旦データ辞書化することにより、情報システム全体のガバナンスを実現する突破口にもなるだろう。
さらに、こうすることにより、今後データの意味の乱れを抑止することも可能となるだろう。
次回は、他のデータ管理手法にどんなものがあり、既存システムの保守効率化に適用する場合のメリット・デメリットなどを検討しよう。
最後に、弊社主催のセミナーを紹介します、是非、ご参加ください。
2月5日(木):【第1部】第24回 データベース特別研究会
【第2部】事例に学ぶこれからのシステム保守
保守コストダウン実現とナレッジ継承
コンサルタント 市堀 誠治
« 保守生産性向上 データ辞書を不用の用から要(かなめ)の用へ保守生産性向上 データ辞書を不用の用から要(かなめ)の用へ »
























