前回は、議事録のXML化について紹介したが、今回は論文のXML化だ。
ウィトゲンシュタインは、「論理哲学論考」で独特の文体で自らの思想を表そうとした。このblogを読む人には説明がいらないと思うが、一時は論考を読むことが哲学をすることと等しく扱われたほど、哲学界に影響を与えた論文である。論考自体について論じるのもやぶさかではないが、そんな時間はないので、本題に入る。
プロジェクトグーテンベルグにその英訳があるので参照してほしい。すべての文章に番号がついている。桁が多い番号は桁が少ない番号の注釈となっている。例えば1.1と1.2は1の注釈であり、1.1.1と1.1.2と1.1.3は1.1の注釈である。桁数が少ないほど重要な命題であり、論考全体では、7つの最重要な命題があることになる。
1.世界は、成立していることがらの全体である。
2.与えられたことがら、すなわち事実とはいくつかの事態の成立に他ならぬ。
3.事実の論理的映像が思考である。
4.思考とは意味をもつ命題のことである。
5.命題は、要素命題の真理関数である。(要素命題は、それ自体の真理関数である)
6.真理関数の一般的形式。【p,ξ,N(ξ)】 これは命題の一般的形式である。
7.語りえぬものについては、沈黙せねばならない。
この7つの命題を頂点とする階層構造のある512個の命題によって論考は成り立っている。論考を普通のテキストとして読もうとするととても読みにくいのだが、ハイパーテキストを使って表示するとこうなり、全体の構造を図示するとこうなる。さらに、アウトラインプロセッサー化して日本語訳も作っている日本人の方もいる。
ウィトゲンシュタインが生きていたら、嬉々としてアウトラインエディタを使ったことだろう。
論文をXML化するメリットがなんとなく感じられてきただろうか。実は、論文のXML化というのは様々な学会で試験的に導入されてはいる。しかし、その目的は、HTMLと紙と検索のすべてにに出力することを容易にするという純粋に情報システム屋さん的な発想でしかない。
ウィトゲンシュタインがこのような方法を取った理由はいくつか考えられる。彼が命題と要素命題の関係について深く思索していたこともさることながら、分かる人にとっては、もっとも簡便に理解できるようにしたかったからに違いない。
彼は、(命題を含む)記号の空間的配置が意味(Sinn)を作り出すということについて自覚的だったが、話を大きくしてしまえば、記号配置の写像関係は、数学がなぜ世界を表現しうるかという問題につながるのである。
さて、ここではそんなでかい話には触れないで、プラクティカルな話にとどめておこう。ウィトゲンシュタインは残念ながらアウトラインにしか気を配れなかったが、インラインタグを入れることによって何が起きるのだろうか。
今日の話の要点は、
1.意味と意図の明確化
2.表現とデータ構造の分離
2-1.コンテクストによる表示の多様性
2-2.滑らかさと躓きの共存
2-3.図とテクストの融合
であるが、その前に具体的にどのようにして論文をXML化すべきなのかについて紹介しよう。
ぼくは、生命と認知についての自分の思考を、XML論文としていずれ表現したいと考えている。そのための執筆と閲覧のためのアプリケーションも開発しなければならないだろう。
XMLのインラインタグとしては、以下のようなものを用意するとよさそうなことは容易に想像できる。
定義
特徴と性質
可能性(様相)
条件
引用
構造
例示
演繹(推論)構造
分類
反論の余地
主観的自信度
図(中のオブジェクト)と文の関係:代数と幾何の関係、概念と概念の関係
意図
形容対象
実証度(自分が経験したのが、自分で読んだのか、自分で見たのか)
これらは誰でも考えそうなことだ。ぼくは自らの思想の表現のために、新たな文体をつくらなくてはならないだろう。それはまだこれからのことだ。
さて、これらのインラインタグを用いることによって何が起きるのか。
1.意味と意図の明確化
もう何度も繰り返し言っていることだが、インラインにせよアウトラインにせよ、タグ付けは意味の明確化に役立つ。例えば、
<proposition id="1"><person id="2">ウィトゲンシュタイン</person>がこのような方法を取った理由</proposition>はいくつか考えられる。<reason ref="1"><person ref="2">彼</person>が命題と要素命題の関係について深く思索していたこと</reason>もさることながら、<reason ref="1" 主観的自信度="50%">分かる人にとっては、もっとも簡便に理解できるように<subjent ref="2">したかった</subject>から</reason>に<intension type="強調 レトリック">違いない</intension>。
という文があったとする。通常「~に違いない」という命題があったときには、様相的に必然であると解釈される。ところが、この文において「~に違いない」は強調とレトリックが意図されており、命題自体の自信度は50%にしかすぎないことが分かるだろう。
また、ウィトゲンシュタインという人間は、「彼」でもあり、「したかった」人でもあることも明確だ。
2.表現とデータ構造の分離
2-1.コンテクストによる表示の多様性
例えば、上の例のようなXMLがあったときに、タグの中をすべて表示するのは読みにくい。しかし、表現とデータ構造が分離することができるので、タグの中をすべて無視して表示することもできるし、多少重要ならポップアップさせるのもいいだろう。
ウィトゲンシュタインがこのような方法を取った理由
ウィトゲンシュタインがが命題と要素命題の関係について深く思索していたこと
分かる人にとっては、もっとも簡便に理解できるようにしたかったから
という表示も可能だ。そのままレジュメになる便利さだ。
2-2.滑らかさと躓きの共存
もちろん、この箇条書き表示から逆に自然な文章をつくることはできない。自然な文章の持っている文の滑らかさは、文学だけでなく論文においても必要だ。しかし、読者は文の意味が分からなくなるととたんに躓く。読者の躓きに対応しようとすると文の滑らかさが逆に失われてしまう。文の滑らかさは、著者の物語を読者が共有するための武器なので、これは最大限に尊重したい。多くの著者はこの問題に悩まされ続けてきて、人によっては本文より長い脚注をつけたりしてきた。ウィトゲンシュタインの場合はその極端な例で、論文全体が「語りえぬものについては沈黙しなくてはならない」という命題に対する注釈なのである。
XMLのインラインタグを導入することによって、滑らかさを残したまま、多様な読者の躓きに対応することができる。
2-3.図とテクストの融合
上記でリスト化したインラインタグの中には、ある種の概念と概念の構造を示しているものがある。それらは、読者に表示するときに図として表示すべきであると同時に、執筆時においても図として描かれてもいいはずだ。
昔、プログラマーはテキストエディターでソースコードを書いてきたが、今ではヴィジュアル開発環境を用いてUIを作るし、モデルの部分もUMLからソースコードを自動生成することもある。少なくともデータフローのスクリプトライティングに関しては、DataSpiderやAsteriaのような製品を使えば図として定義することが可能だ。それらでは、ソースコードから図、図からソースコードへの変換が可換であり、相互に等価な内容の異なった表現にしか過ぎない。
テキストは図の一部である。テキストは一次元に配置された特殊な図である。図の表示方法としてテキストを選んでもよいし、狭義の図を選んでもいいのである。
このようにして、図とテキストが融合していくだろう。
論文の論理構造が、自動的に図示されたり、もしくは図を作ることによって論文を書くことは、単に読者にとって分かりやすいだけでなく、著者にとっても自らの論の構造に不備がないかを確認する手段となる。これは議事録XMLのValidationと同様だ。
いずれ、<反論の余地 反論="そのような執筆は自由な文章のもつ表現力を損ない、文体を単一化させ、芸術をつまらなくする" 反論への反論="しかしながら、歴史上、ある種のメディア的不自由さによって芸術は発展してきたのであり、言語という不自由さによってすばらしい作品が生まれてきたことを忘れてはいけない。我々はそれを使わないこともできるし、使うこともできる。そういう意味において、自由は拡大しているのであり、新しい芸術の余地を生み出しているのである">文を書くということはオブジェクトを配置することと等価になるかもしれない</反論の余地>。ハイパーマップを思い出してほしい(知らない人はごめんなさい)。ハイパーマップのオーサリング環境ができたとすると、それはあたかもオブジェクトを配置するかのようになされるだろう。そしてその配置されたオブジェクトを彩るのが、人間の脳だけが可能な物語性の付与なのだ。ぼくはそんなソフトが欲しい。
素敵なソフトが欲しいけど、あんまり売ってないから、好きなコトを書く。
ぼくのblogはそんなトコかもしれない。