どの学問分野に分類すべきか、時折、そんな悩ましい書に出くわす。いや、分野に縛られない自由さこそ学問というものか。
本書の由来は「学習理論と認識論」と題した講義にあるという。哲学、人文学、情報工学、統計学、認知科学などの学生を対象に。著者には、哲学研究の専門家ギルバート・ハーマンと情報科学の専門家サンジェーヴ・クルカルニの名が連なる。知的活動に文系も理系もあるまいが、あまりに学際的。認識論的な思考過程として演繹法と帰納法の意味を探ることに始まり、機械学習的な思考過程としてニューラルネットワークやサポートベクターマシンを論じ、さらにトランスダクションにも触れる。そこには、確率論的な数式やベイズルールが散りばめられ、VC 次元のお出ましとくれば、とりあえず数学に分類しておこう。
ちなみに、数学は哲学である... というのが、おいらの持論である。
尚、蟹池陽一訳版(勁草書房 - ジャン・ニコ講義セレクション)を手の取る。
本書の記述が数学的な側面が強いとはいえ、やはり認識論の領域であろう。あらゆる学問が、人間の認識能力に発するのも確か。この宇宙に存在する一切の事物、あらゆる現象に、意味や意義なんてものはあるまい。おそらく。
だが、人間ってやつは、何事にも意味を与えずにはいられない。精神や魂といった概念を編み出しては、これに縋り、自分の人生に意味を与えずにはいられない。
それはきっと、認識能力を獲得したせいであろう。すべてを神のせいにして楽になれるなら、神の存在意義も絶大となる。結局、どう認識するか、どう解釈するか、ということに帰着する...
人間の認知能力が、あらゆる知識、事象、現象を分類したり、抽象化したりする。それは、機械学習のアルゴリズムが、ラベル付けされたデータから規則性を見つけ、定義し、分類する振る舞いと似ている。ニューラルネットワークやサポートベクターマシンは、ラベル付けされたデータ、分類化されたデータを用いる。つまり、扱うデータは、経験値がきちんと記述できる形になっているわけだ。
しかし、人間の認知能力は、記述できない、言葉にできない領域にまで広がる。そこで、トランスダクションという概念は、そうした領域にまで手を広げるものとして紹介される。
人間の推論メカニズムは、きわめて線形的で、連続的ではあるが、時には、分類の困難な、非線形な、矛盾や不合理までも相手取る。気まぐれってやつも、その類いであろうか...
物質に素粒子という素があるように、認識にも素となる命題めいたものがある。
例えば、ユークリッド原論の公準がそれだ。それは、これ以上証明のやりようのない純粋な要請であり、論理学の限界を示している。第五公準はおいといて。幾何学は、この公準を基点として組み立てられてきた。
その際、証明手順に演繹法と帰納法とがある。前者はきわめて純粋で、証明の王道といえば、おそらくこちらであろう。だが、現実は後者の方が有用なことが多い。誰もが疑いようのない明確な論理的過程よりも、経験を蓄積し、分析し、学習し、知識の精度を上げていく過程の方が実践的でもある。
ここでの関心事は、帰納法的学習の信頼性である。推定の難しさ、複雑さとして、VC 次元を持ち出し、その意味は「粉砕」によって説明される。
「粉砕」ってなんだ?大数の法則のようなものか?うん~... エントロピーに埋没しちまいそうな。推定の難しさは、簡単に言えばコンピュータの計算量ということにもなろうか。
「反省的均衡」という用語にも注目したい。それは、積分的な思考とでも言おうか。帰納法の目的が、これだ!と言ってもいい。帰納的な思考過程では、信念バイアスがかかることも留意しておこう。
そして、枚挙したデータ群から誤差を最小化する思惑、反証可能性の程度、単純な仮説の想定、正弦則による予測、カーブフィッティングを用いた実数値の推定など、基本的には線形性を想定した確率論的な推論を軸に検討が進み、やがて非線形や離散的なデータをも取り込む。トランスダクション・モデルに至っては、道徳的個人主義にも適応できるとさ...
いま、アラン・チューリングの問いかけを想起せずにはいられない。機械は意思を持ちうるか、と...
「統計的学習理論の最も偉大な発見の一つ、規則集合のヴァプニク - チェルヴォーネンキス次元、すなわち、VC 次元の重要性の発見。規則集合の豊かさの測度。反証可能性の度合いに反比例。VC 次元を持つ時、背景にある統計的確率分布が何であろうと、十分な証拠を条件付きとしてうまく得られる。」
0 コメント:
コメントを投稿