理由や根拠を求めない:検索、AI人工知能

理由・根拠を求めるのは、大げさな言い方をすると人間のサガなので、それを全く求めないような文明社会になるとは思わないけれども、備忘録として書き留めておきます。(備忘がこのブログに私が期待する事の一つです)

 

20世紀になって、物理は細かい事を調べるようになって、ふだん経験しないような自然現象が目の前に山積みになりました。その結果、20世紀の物理は

  ・実験結果に合っている事

を大事にし、他の事

  ・理由や根拠が説明できる。納得がいく。

  ・論理的に一貫している。つじつまが合っている。

  ・数学的に正しい計算を行う。

ことを二の次にするようになりました。

 

内心では理由や根拠を求めているけれど、表面上はとりあえず、

  ・根拠を求めない

  ・事実そうなっていれば良し

というようになりました。

 

同じことが、グーグル検索や学習するAIで起きている気がします。

 

---

 

グーグル検索について:

 

コンピュータでデータを整理する場合、ツリーと表が良く使われます。

 

ツリーで整理するのは、動植物の分類に始まり、ファイルのディレクトリ/フォルダ、オブジェクト指向プログラムのライブラリ、などに見られます。

 

表形式で整理するのは、本の目次と索引、表計算ソフトExcel、などに見られます。

 

一方、リンクされたデータの集まりは、整理されているように見えません。

昔、表形式のデータベース(リレーショナル・データベース)が登場する直前に「ネットワーク型データベース」というものがあり、すぐに市場から姿を消したそうです。インターネットのような形でデータを見せられても、それが整理された形には見えないため、ネットワーク型データベースを使いたいと思わなかったのでしょう。

 

インターネットでも、グーグルが登場する直前は、ヤフーが分野別に分類したサイトの案内ページを提供して商売繁盛していました。それはインターネットをツリー状に整理する、ということです。しかし、大量に新規登場するサイトを人力で分類・整理するのは追い付かず、グーグルが提案する「機械的に検索すれば良い」に負けました。

 

これは、ネットのような膨大な情報の前では、それを理解・把握するのをあきらめて、「根拠はわからないが、出てきた検索結果が役立てば良い」という価値観を人々が採用した、ということです。

 

なんだか、20世紀の物理が、とりあえず実験結果に合っている事を重視した、ことに似ています。これを、いささか強引に敷衍すると、

  ・世界を理解、把握しようとする科学の営みは必要ない

  ・(検索)結果オーケー!

という傾向に思えます。

 

---

 

学習するAIについて:

 

ヒトが作る文章は、例えば

  犬が水を飲む

のように、主語(犬)、目的語(水)、動詞(飲む)、からなります。これをコンピュータ用語でいうと

  主語:ハードウエア、電子機器

  目的語:データ

  動詞:アルゴリズム

となり、ソフトウェア=データ+アルゴリズム、となります。

 

1950年頃にコンピュータのプログラミング言語はFortran(数値計算のためのプログラミング言語、ミサイルの弾道計算などに使ったらしい)とLisp(記号処理のための言語、人工知能研究が目的)ではじまりました。事務処理のためのCobolが登場するのはしばらく後です。この時のAIをAIー1と書くと、AI-1は動詞=アルゴリズム人工知能を実現しようとしました。

万能アルゴリズム、というのを求めたらしいですが、当然、どんな問題も解ける万能な処理手順は見つかりませんでした。

 

1980年頃のAIをAI-2と書くと、これは目的語=データで人工知能を作ろうとしました。専門家の知識を集める一方、アルゴリズムはif-thenルールという一番単純なものにし、さらに特殊なハードウェアで速度の向上を図りました。しかし、経験と勘を明文化するのが難しかったりして、うまくいきませんでした。

 

この後、脳の働きをマネするニューロとか色々試みられて、現在、成功を収めつつあるのが学習するAIです。これをAI-3と書くと、AI-3は既知の問題と正解のサンプルを大量に学び、問われた未知の問題に対して、正解の確率が最も高いと思われる回答を出してきます。

 

このAI-3の手順は、科学では良くおこなわれている手順で、例えば

1個10円

5個40円

10個120円

のとき、4個ならいくらでしょう?、みたいな事です。

 

科学実験だったら最小二乗法で直線を当てはめて内外挿する、とかになります。この「最小二乗法を使う」というのは、正規分布のような確率分布を想定して、最も正解の確率が高い答えを出す、という事です。「直線を当てはめて...」というのは、いわば、3つのサンプルを学習してAIが結果を出す、ともいえる操作です。

 

さて、ここで「1+1は?」という質問をすると、上記3つのAIは

 

AI-1:1+1=2。足し算の法則を使って計算した。

AI-2:1+1=2。ある専門家が「1+1は2だよ」と言っているから。

AI-3:1+1=2。算数の教科書にある数千億の例題から導いた。

 

のように答えを出します。AI-3は、「その2という結論の根拠は?」と問われた時、「数千億のサンプルを、すべて使いました」と言うのです。これでは「根拠が存在しない」のと同じ状況な気がします。

 

物理は

   理論値が実験結果にあっていれば良い。結果オーライ!

と言いつつも、内心では理由・根拠を求めるのですが、実用的なAI、学習するAIには、求めようにも根拠が無いのです。このAIが普及し、物理などの旧来の科学と同じくらい、経済的な豊かさを作り出す、となった場合、もう人々は

   ・理由や根拠は求めない

   ・結果オーケー!

という価値観になってもおかしくない気がします。