» 【123号】情報システムのサイエンス(1)

株式会社データ総研 データ総研のオンサイト教育
製品案内 DMBOK ITコンサルティングサービス ITコンサルティング事例 紹介セミナー 教育コース 技術情報 DRIブログ 会社概要
技術情報
【123号】情報システムのサイエンス(1)

■職人芸の時代
私がはじめてコンピュータを使ったのは、1964年(昭和39年)ころ、東
大に出向し、計算センターでアルゴルのプログラムを紙テープに穿孔して作っ
た時でした。

方程式に初期値を与え試行錯誤の末、解を求める技術計算だったと記憶しま
すが、コンピュータが自分になり代わって答えを出すとは、一種の魔法のよう
に思われました。計算センターに5分ほど歩いていって計算依頼をしても、1日
に1回か2回しか結果は回収できませんから、机上デバッグは重要です。仲間
と何回で通すか競争をしたりした時代でした。
その後会社にもどり、IBM360が入り、カードパンチの時代となりました。
化学プロセスシミュレータがらみのFORTRANによる科学技術計算ですが、
処理にはパターンがありこれに対応した汎用サブルーチンを作って、これをリ
ンク・エディットしてプログラムを作る方式が一般化しました。データの受け
渡しは、はじめはアーギュメントが主体でしたが、次第にCOMMON領域を使い始
めます。したがってその設計のポイントは
(a)処理のパターンを見つけ、対応するサブルーチンを作る
(b)サブルーチンが通信する場としてのCOMMONをいかに設計するか
であると考えました。(a)では抽象化によってパターンを見抜くこと、(b)
では共用性の高いデータをいかに整理すべきかが問題になります。したがって
(a)はオブジェクト指向の発想に近く、(b)はデータモデリングの萌芽と
なるものです。設計基準はまだ見えておらず、職人芸的に決めざるを得ません
でした。
■情報代数の公理
職人芸からの脱皮とはサイエンス指向ということになります。(a)も(b)
もITではなく、それ以前の業務の仕様から決まります。ITがからむとどう
しても職人芸になってしまう。そこでIT独立/実装独立に業務の本質を見る
ことになりました。
また(a)よりも(b)の方が本質的と見えました。すなわち、コンピュータは
その計算機能より、コミュニケーション機能の方が重要と言うことです。そこ
で、インターフェースデータの作る通信場のあるべき姿を考えることになりま
す。このとき見つけたのがCOBOLの仕様を提案した団体CODASYLの出した論文
「情報代数」でした。「情報代数」では
v=a(e)
すなわち
 属性値=属性(エンティティ)
たとえば
 26歳=年齢(松坂大輔)
 18歳=年齢(安藤美姫)
 207=スコア(横峰さくら)
 211=スコア(宮里藍)
の形式を、情報を把握するための公理としますが、これは間違いないと判断し、
これを採用しました。人間もコンピュータも、最終的に検出し把握するものは、
この属性値と考えます。したがって、情報と言っても、記号化された値ありき
の段階からこれを扱うことになります。この点は記号化以前でも良いとするO
Oと違っているかもしれません。
■正規化とデータ中心
次に通信場における「One fact in one place」を原則としました。実世界に
はひとつの真実しかないはずですから、27歳=年齢(松坂大輔)があっては
なりません。実装独立のデータベースの世界には冗長データはありません。こ
れが正規化のベースとなります。第1正規形だ、第2正規形だ、のCODDの難し
い議論は実装従属の世界で必要になるもののように見えます。CODDの論文がI
MSの物理構造からスタートしていること、また今まで何百とデータモデリン
グして、この理論を必要としなかったことがその理由です。
第3に「One fact to all members」を原則とします。昔は「One fact to all
users」といっていましたが、セキュリティを意識してちょっと変えました。
データは原則として公開し共有すべきもの、必然的にデータ中心アーキテクチ
ャにならざるを得ません。
 データベース:プログラム=太陽:惑星
となりますから、地球でなく太陽を中心に置く地動説のアーキテクチャと言え
ます。自己中心的プログラム中心の天動説を卒業しなければなりません。「管
理者なくして標準なし、標準なくして共用なし」ですから、データ管理者は必
須です。データの標準とは、属性の形式と値の標準です。前者はリポジトリが、
また後者はリソースデータベース(マスターデータベース)が規定します。こ
れによってデータがシームレスに流通する文化圏が作られます。文化圏は有限
の大きさにならざるを得ませんが、文化圏の間にもバリアがあってはなりませ
ん。バリアを作る孤島システムは不可です。したがって文化圏間に通信場を用
意するフェデレーションアーキテクチャが必然になります。
■脱白袴
第4の原則として「自己記述」をあげることができます。データモデルはシス
テム開発業務であつかうデータ「メタデータ」にも適用できなければならない
はずです。システム屋はシステム化に標準化が必要なことは良く知っています
が、「メタデータ」は自分の裁量で扱いたがります。紺屋の白袴は不可なはず
です。これによってプログラミングレスへの道が開けると考えます。
■サイエンス指向
以上が情報システムにサイエンスを持ち込むための前提と考えます。いまここ
で、次の3つの表現/可視化アプローチについて考えてみたいと思います。
 ・アート
 ・エンジニアリング
 ・サイエンス
アートとは各人が自分の感性に基づいて表現するもので、自由形式で、図表や、
自然言語によるドキュメンテーションを行うものです。1980年以前のシス
テムドキュメンテーションは、これが主体だったと言えます。
エンジニアリングとは、対象の特性に応じた標準化を導入し、定型化を施した
ものです。すべては律し得ないので、そこは各人の裁量に任せることになりま
す。個人差は標準化によって少なくできますが、標準化には同意が必要になり
ます。大きな組織ではこの同意をとることが一大難関となります。
サイエンスが確立したあかつきには、個人差の出ない成果物が得られるものと
考えられますが、物理学の世界と違って、人間のからむ情報問題ではなかなか
難しいのが現実です。そこで私は、現実に使われている画面・帳票を収集し、
そこに現れている属性値を比較・分類することによって、サイエンスを取り込
もうと考えました(次号に続く)。