2026年3月4日水曜日

視点を変える23 人工知能3 言語が見せる世界

 さて「物語」と言えば、もう一つの文章、野矢茂樹「言語が見せる世界」と接続する。

 この文章の「問い」は何か?


 「相貌とは何か?」「概念とは何か?」などの問いも文中には明示されているし、これらはもちろん重要な問いではある。「プロトタイプ」も気になる。

 だがそれらの問いがどこから生じたかと言えばこれだ。

我々は世界をどのように見ているか?

 この答えは?


通常は「物語」において見ている。

というのが端的な答えだ。

 とすると、これは松田の論と共通していることが明らかだ。人間が椅子に座れるのは「椅子に座る」という行為を「物語」として生きているからだ、というのが松田の主張だった。

 そしてその「物語」は身体によって成立する、というのだが、野矢茂樹は「物語」を論ずるのに身体を持ち出さない。言葉がすでに「物語」を携えているのだ。

 当然だ。言葉は単体で宙に浮いているわけではなく、前後の文脈の中で使われ、理解される。それはすなわち「物語」の中にあるということだ。

 となればますます現在のAIは「物語」において「椅子に座る」ことを捉えるに違いない。

 やはり人工知能は椅子に座れるのである。


 さて、ここまでの「視点を変える」の流れに、この二つの文章も位置付けよう。

 「言語が見せる世界」という題名は、もうそのままおなじみのソシュール言語学だ。我々は言葉によって世界を認識する。

 ここでは、言葉はスキーマでありメディアだった。そういえば「言語が見せる世界」とは「メディアがつくる身体」にそっくりパラフレーズできる。世界「観」のことであり、身体「観」のことだった。

 一方「人工知能はなぜ椅子に座れないのか」には次のような文章がある。

例えば、…初めてこの世界と対峙することになる赤ちゃんは、この世界を知るために、…彼ら(彼女ら)は、手足をばたつかせながら、「周囲の環境に何があるか」を発見するでしょう。それと同時に、「自分自身の身体がどのようなものであるか」を発見するでしょう。/無限定な空間において、私たちは、周囲の環境という「場」と、自分自身の身体を基準とする「自己」とを、順次、理解していくのです。

 これはつまり、身体はメディアであると言っているのだ。とすれば、身体はスキーマでありフィルター(フィルターバブルにおける)だ。

 一方で身体「観」ということはゲシュタルトでもある。

 スキーマでもありゲシュタルトでもあるというのは、思い出してほしい、「地図」もそうだった。もちろん地図もメディアだった。


 我々は言語を通して、身体を通して、地図を通して、メディアを通して世界を認識する。それぞれの「世界」は、それぞれのスキーマによって様々だ。そのゲシュタルトがそれぞれの身体「観」であり、様々に表現される地図なのだ。 

 スキーマがゲシュタルトをつくり、できたゲシュタルトはスキーマとして機能する。スキーマとゲシュタルトは循環する。

 授業を通して文章を理解するとは、つまりゲシュタルトが生成された(ダルメシアン犬が見えた)ということだ。

 それが次に読む文章を理解させるスキーマとして機能する。


視点を変える22 人工知能2 反論

 「人工知能はなぜ椅子に座れないのか」という問いは「座れない」ことが前提されている。だがその前提には素朴な疑問が生ずる。

 ロボットに、椅子に座るようプログラムする。姿勢制御などの工学的な課題がクリアできるならば、ロボットは椅子に座れるだろう。工場のラインなどでロボットアームが複雑な作業をするのはもう数十年前から可能だった。

 これは「座れる」ことにはならないのか?

 この疑問に松田は、それは座れていることにはならない、と答えるだろう。だがどういう理屈で松田はこの実例に反論するか?


 ロボットが自主的・主体的・能動的に座っているわけではないという反論は無効だ。

 この例では、その行為が自主的であるかどうかを問題にはしていない。ロボットにはそもそも座りたいなどという動機はない。人間に対して「座って」と言ってその人が座るとしても、それは「自主的」ではない。

 問いは「なぜ座らないのか?」ではなく「座れないのか?」だ。

 では?


 「コミュニケーション」から話を始め、「意味」について考察する本論の展開では、単なる行為の実行ではなく、「座らせよう」という「意図」がロボットに理解できるかどうかが問われている。

 そうしてみると、やはりロボットは「座れる」ように思える。「コミュニケーション」とは、こちらの送った信号によって相手の振る舞いが変化することを言うのだと本文に書いてある。座るようにプログラムしてロボットが座ったら、それはコミュニケーションが成立していることになるはずだ。振る舞いが変わったのだから、「意図」は伝わっている。

 なのに松田はなぜ「できない」と言うのか?


 それはAI自らが「意図」して座ろうとしているのではないからだ、という反論は有効か?


 だが本人に「意図」があるかどうかが、なぜわかるのだろう?

 「座る」という動作ができてしまえば、それは「意図」があったということなのではないか? 彼は座ったが彼には座る意図はない、などということがなぜ言えるのか?


 だからここは本当にAIに「できない」例を挙げればいいのだ。

 例えば授業で挙がった例では、面接会場でロボットに椅子に座るよう促してロボットは座ったが、面接官の方を正しく向いていなかった、などという例。これはうまい。「適切に座る」ことはできない。自然さの判断ができない。

 では「面接官の方を向いて」と指示の中に記述すればできるのか?

 それはできるかもしれない。だが、椅子が複数ある部屋で「どれでもいいから座って」は難しいかもしれない。

 円筒形のスツールやソファしかない部屋で「椅子に座って」も難しいかもしれない。

 あるいは「適当にどこか座ってて」も。


 こういう例が挙がれば、動作として「座る」ことができるロボットでも、指示や命令によって「座る」ことができない、つまり命令の意味が理解できない場合が示せる。


 さて、さらに反論。今度は松田に対して。

 松田の論の趣旨がわかったとして、それでもやはり現在のAIは椅子に座れるのでは?

 この反論は「物語」とは何か? という問題に関わっている。

 「椅子に座る」ことが理解できるということは「椅子に座る」という「物語」を生きることができるということだ、それには身体が必要だ、というのが松田の論の核心だ。

 「物語」?


 物語と言えば、今年読んだ文章では「大きな物語」を想起したい。

 「大きな」は、多くの人に共有されている、という意味だが、「物語」とは何か? 

 それは言ってみれば、複数の要素がつながっている状態であり、それが、よくあるパターンとして学習されているということだ。典型的な連続性がそこに見られるということだ。次の展開が予想できる状態。

 ここから連想したいのは「メディアがつくる身体」の「予期の織物」だ。

 この考察はここ→にも書いた。

 「予期」とは「振る舞い」に対する「予期」だ。

(メディアは)自分が可能な振る舞いを変容させ、他人の振る舞いに対する予期を変容させ(る)

 こういうときにはこう振る舞うものだ、という「予期」が働くのが「社会的身体」であり、これは昨今の生成AIのLLM(大規模言語モデル)の仕組みと同じだ。

 これはAIが「物語」を理解しているということであり、むしろそれは身体を通してというより言葉(や画像)を通して学習されているのかもしれない。

 松田は、川原の岩に腰を下ろすのは身体があるからだと言う。これはAIにはそれができないという前提で挙げられた例だ。

 本当にそうなのか?

 いや「川原の岩に腰を下ろして」という文章(言葉)を学習したAIは、岩を座れるものとして認識することができるに違いない。

 現在のAIは、身体にとっての必要性を介することなく「物語」を理解できるはずだ。


 「振る舞いを変容させる」などというフレーズがあると、もっと時間があれば「メディアがつくる身体」と「人工知能はなぜ椅子に座れないのか」を読み比べよ、と投げ出してしまうこともできたのに、と終わりが迫った年度末の授業の余裕の無さが残念ではある。


視点を変える21 人工知能1 読解メソッド

 松田雄馬「人工知能はなぜ椅子に座れないのか」は、いくらかカットしたものが「ちくま評論入門」にも収録されている。これを野矢茂樹「言語が見せる世界」と読み比べる。松田は理系の研究者、野矢は哲学者。人工知能と言語。どうつながるか?

 そしてこれもまた「視点を変える」の流れに位置付けられることも意識して考えていこう。


 まず「人工知能は~」。

 今年度、何度も実行した読解のメソッドは「一文要約」「問いを立てる」「対比をとる」だ。

 このうち「問いを立てる」にしたがっていえば、これはもう題名が問いの形になっている。

 だが読んでみると、この問いは裏にもう一つの問いを隠していて、どちらかというとそちらの方の問いにこそ重点があることがわかる(わかってほしい)。

 その裏の問いを明らかにするには「対比」の考え方が有効だ。

 この文章のメインの対比は何か?


人工知能/人間

 これが最重要の対比であることがわかれば、裏の問いも明らかになる。

人間はなぜ椅子に座れるか?

 これらの問いに、最も端的に答えてみよう。

身体がない/あるから

 授業ではこの答えが出る前に「目的」「意図」「意志」「意味」「物語」などの言葉が挙がっていると面白い。これらより「身体」のあるなしが最も根源的であることがわかるだろうか?

 「意味がわからないから座れない」は正しいが、これは「なぜ意味がわからないのか?」という問いを導き出す。その答えが「身体がないから」だ。

 「身体がないから意味がない」とは言えるが、「意味がないから身体がない」とは言えない。だから「身体」の方が根源的な原因なのだ(もちろんこれはこれで「なぜ身体がないと意味がわからないか?」という問いにつながり、それにも答えられるように読解する必要はある)。


 これで文章を読むためのスタートとゴールが確認できた。

 とはいえまだこれはスタートとゴールであって、この、問いと答えの間がどのような論理で結ばれているかを辿れてはじめて読解できているといえる。

 ついでに「一文要約」もこれでできている。「人工知能が椅子に座れないのは身体がないからだ。」「人工知能は身体がないので椅子に座れない。」といえば、確かにそういうことではある。

 だがこの文章の場合、これでは何のことやらわかりにくい。論理の飛躍があるように感じる。

 それでもこうしたメソッドは意識してでも使う。使ったときと使わないときの理解度には大きな差がある。使おうとすることが頭の使い方を集中させる。次には「椅子に座れない」と「身体がない」の関係を把握することに頭を使えばいい。

 さて、身体を持っているから椅子に座れる(身体がないから椅子に座れない)とはどのような論旨なのか?


 論理展開を概観するために、さらに一文要約を応用する。

 この文章には1行空きで中段落が示されているから、その区切りで1文にする。ただし、3段落目は長いので2文にする。計4文。

 1,2段落はひどく要約しにくい。そしてさらに、1段落から2段落への論理展開がよくわからない。

 それでもなんとかやってみて、さて、3段落に入ると、最初にこんな文章がある。

「コミュニケーション」とは、シャノンらによると、相手に信号を伝え、「意図」を伝えることで、相手の振る舞いを変化させるということでした。そして「意図」とは、自分自身の目的のようなものだと考えられます。ここからは、「椅子」を通したコミュニケーションについての考察を更に深めることで、振る舞いが変化していく様子について理解し、更に、生命が生きるということがどういうことかについて論じていきたいと思います。

 なんだ。本人がここまでをまとめている。前半は1,2段落の要約になっていて、後半が3段落の予告になっている。

 ここらでこの文章の問題点が見えてくる。

 この文章は、そこここで問いの投げかけやそこまでの「まとめ」が挿入されて、一見すると読者に対する気遣いの行き届いた、読みやすい文章のように見える。

 筆者である松田さん自身はそうしようとしている。だが実は論理展開はきわめてたどりにくいと言っていい。その自覚は本人にはないだろうが。

 この、論理の辿りにくさが、例えば上の一節に現れている。

 上記の一節、1,2段落の要約を、いくらか形を整えて並べてみる。

  1. 「コミュニケーション」とは、相手に「意図」を伝えることで、相手の振る舞いを変化させるということである。
  2. 「意図」とは、自分自身の目的のようなものである。

 これが筆者自身による1,2段落の要約だ。

 この1,2の「意図」が意味するものは全く違う。これは本当にひどい。重要なキーワードが、展開する中で全く違ったことを指してしまうのでは、論理がまともにたどれない。

 それぞれ何を指しているか?


 違いを言うためにはむしろ言い方を揃える必要がある。「I was born」の「文法」と「蜉蝣」を対比するためには、「生まれる/生む」と言い方を揃える必要があったように。

 また、それぞれの「意図」がどういうことかを直接表現しようとすると話が抽象的な説明になってしまって、違いがわからない。

 そこでここでは「相手」「自分」「振る舞い」が何のことかを、ここでの例で特定する。何のこと?


 問題設定の「人工知能は椅子に座れるか?」からすれば、1の「意図」は座らせようとしている側の意図のはずだ。人間が人工知能の「振る舞いを変化させ」ようとしているのだから。

 だが2の「目的」「意図」は「椅子に座る」だから、「自分」とは座ろうとしている人、だ。上の問題設定をひきつぐなら、人工知能を指していることになる。

 端的に言うと以下のようになる。

1.AIを「座らせよう」とする人間の「意図」

2.「座ろう」とするAIの「意図」

 こういう、言葉の指し示すものが不統一なのに無自覚に論を進めているところが読みにくい。なのに一方ではところどころで要約してみたり問いを明示したりして書き進めているところは、筆者なりには読者に配慮してもいるのだ。なんだかなあ。


 続けて後半を2文で要約してみよう。

  • 生物は身体によって世界を(対象を)認識する。
  • 生物は世界を(対象を)「物語」によって捉える。

 この長さにしてしまうと、何のことかちっともわからない。上の2文とつなげても、論理の展開がたどれない。

 試みにAIたちに要約させてみる。


Gemini

情報の真の意味は、受け手が送り手の意図を理解し、自身の行動を変化させて初めて成立する。人間が「椅子」を認識できるのは、身体を持ち、自らの人生という「物語」の中で「座る」という目的を即興的に作り出せるからだ。対して身体のない人工知能は、記号を処理できても行為の意味を理解できない。自らの意志で環境に意味を見出し、人生を生きるという行為は、現状では身体を持つ生命にのみ許された特権である。


ChatGPT

信号は受け手が意図を理解し行為に結びつけて初めて情報となる。椅子を形の特徴だけで定義しても例外が生じ、座るという行為の可能性を捉えられない。人間は身体をもち、疲労や作業といった目的を自ら生み出し、自己の物語の中で岩さえ椅子として意味づける。意味は身体と環境との関係の中で即興的に立ち現れるが、身体と物語をもたない人工知能は自ら意図を形成し意味を創出できない。


 これはかなりもっともらしく書き下ろされてはいる。だがやはり1文目から2文目にかけて、また前半と後半の論理的つながりがわかりにくい。これは原文が悪いからだ。理系の研究者とはいえ、文章が「論理的」であるとはどういうことか、もっと自覚してほしい(とはいえ文系の石井美保さんの文章も実にわかりにくかった。が、あれはまた別のわかりにくさで、そもそもあれは「説明文」ではないのだ)。



よく読まれている記事