機械学習とディープラーニング〈第3次人工知能ブーム〉――ChatGPTの基礎知識④by岡嶋裕史
過去の連載はこちら
岡嶋さんの好評既刊
ChatGPTはここから始めることができます
機械学習とディープラーニング〈第3次人工知能ブーム〉――ChatGPTの基礎知識④by岡嶋裕史
機械学習の登場
第3次ブームは鮮烈だった。
ブームを勃興させる原動力になったのは機械学習だ。
AIはルールによって動く。そこは間違いない。奇想天外な別の方法で動き出したわけではない。将来もそうかもしれない、AIが置換することを目指しているヒトの脳だって、何らかのルールに従って動いているのだろうから。
ルール間の調整をする作業がおっそろしく膨大でしちめんどうだったのが、訓練用の学習データを与えれば自動で(場合によってはルールを作るところまで)やってくれるようになったのである。開発者が楽をできる意味において大進歩である。
もちろん、そのための枠組みを作ったり、学習データを用意したり、学んだ結果を検証したりと開発者は血尿不可避なほどに忙しいのだが、それでも一番大変な部分が自動化されたことは極めて大きなインパクトをもたらした。
機械学習は大きく3つの手法に分類できる。
教師あり学習、教師なし学習、強化学習である。
教師あり学習はお手本を見せていく学習方法だ。りんごの写真を見せて、「これはりんごだよ」と教える。このとき、写真に対して添える言葉「りんご」をラベルと呼ぶ。何枚も何枚もりんごの写真を見せていき、「データがこうしたパターンのときは、りんごなんだ」と学ぶのである。
教師なし学習はお手本なしで、大量のデータを見せていく学習方法である。お手本なしで学んでいくので、「これはりんごだ」「そっちはうどんだ」などとわかるわけではない。でも、データのなかからパターンを抽出することはできる。データから上手にパターンを抽出できるようになったら、人間はそれを見て「おお、今まで気付かなかったこんな購買傾向があったのか」などと分析するのである。さっきのりんごとうどんの例で言えば、2つのパターンを見つけたとして「こっちのパターンはりんご」「こっちのパターンはうどん」と後から教えてあげることもできる。
強化学習は、目的に対して試行錯誤させることで、目的を達成できるような行動を見つけていく手法である。ロボットに逆上がりを学習させたいとして、目標である逆上がりは示すが、どんなふうにすればいいかは教えない(違う言葉で表現すれば、やり方がわかっていなくても学習させられる)。
ロボットは手当たり次第にやれる行動を取ってみる。愚にもつかない行動も取るだろうが、逆上がりに至るような惜しい行動も取るだろう(足を振り上げるとか)。目標に近づいたら加点を、遠ざかったら減点を行って試行錯誤を続行させることで、だんだん目標を達成するための望ましい行動を選択するようになっていくのである。
もちろん、どれが一番よくてどれが駄目で、という関係ではない。それぞれの手法を組み合わせて望ましい結果を出していく。
将棋の例をいまいちど挙げると、名人の棋譜を喰わせることで教師あり学習を行うことができる。名人の指し手に近づくように自らを調整していくのだから、そりゃあ強くなる。ただし、限界もある。喰わせるデータが枯渇するのだ。将棋の棋譜は大昔から残っているが、100億だの100兆だのといった数があるわけではない。早晩、データはなくなる(なくなった)のである。
また、名人の指し手を参考にするなら、名人を超えることはなかなか難しい。
そこで強化学習を組み合わせる。たとえば、AI同士でばんばん対局を行う。ランダム性を取り入れるから、同じ指し手に集中することもない。有効な棋譜がどんどん貯まっていく。
将棋の場合はゴールが明瞭で、「相手に勝つ」ことだから、試行錯誤の末のよくわからん手でも勝ったならば、あるいはその一手で局面がよくなったならば「この指し手はいい手だったのだ。この手を指す確率を上げよう」と自分の行動を「強化」する。これを1億回、1兆回と繰り返していけば、はかばかしく強くなる。
ぼくはプロ棋士が初めてAIに負ける瞬間を取材していた。そのときは将棋界にとって驚天動地の事件と受け止められたが、いまそんなことで驚く人は誰もいなくなった。
ディープラーニングという切り札
さらにディープラーニングという切り札も登場した。
人間の脳を模倣したモデルで、人工ニューロンをつないだニューラルネットワークを作る。
人工ニューロンはこうしたものだ。いくつかの入力に対して、条件に応じて出力を行う。これを組み合わせるとニューラルネットワークになる。入力→中間→出力のシンプルなニューラルネットワークを「3層」と表現するが、中間層のニューロンが増えて全体が4層以上になったものをディープニューラルネットワークといい、それを使って学習を行うことをディープラーニングという。
上記リンク先の図はディープニューラルネットワークの一例だ。
学習を進めることで、たとえばある中間層では眉毛に反応し、ある中間層では尻尾に反応し、といったようにネットワークが育っていく。しかも、「どんな点に注目すればいいか」(将棋の例で言えばルール。より一般的には特徴量)を自分で見つけてくれるのだ。めちゃくちゃ楽である。
おそらく人間の脳もこのように機能していると考えられているが、これが激烈に効いたのが画像認識と自然言語処理である。他の分野にも進歩をもたらしているが、今までの主要な成果はこの二分野に集中している。
画像認識では双子を見分け(それまでの「AI」は8とBを見分けるのも苦手だった)、自然言語処理ではご存じのGPTシリーズに貢献した。多くの人が熱狂するのも無理はない。少なくとも、表層的とのそしりを受けつつも、特定の分野においては人間を超えたのである。
なお、それぞれの学習方法は排他的な関係にはない。教師あり学習と教師なし学習を組み合わせることも、ディープラーニングと組み合わることも可能である。多くのAIモデルはGPTシリーズも含めて、これらを組み合わせて育てられている。
ChatGPTにはサムズアップボタンとサムズダウンボタンがついている。示された回答がよいと思えばサムズアップを押し、いまいちだぞと思えばサムズダウンを押すことで私たちはChatGPTにフィードバックを送っている。それが、次版のGPTを育てることに使われるだろう。ぼくらはChatGPTを使いつつ、ChatGPTの開発に貢献している。もちろんそれをタダで(ChatGPT Plusならお金を払いつつ)使役させられていると考えることも可能だ。
連載第2回で申し上げたように、「超えた」だけでは人や社会はその製品を受け入れない。知らないものは気持ちが悪いのだ。使う準備もできていない。だが、AIの場合は第1次から第3次まで断続的に続いたブームがあった。
人々はAIのビジョンを知り、業務に入ってくる様を横目で眺め、神格化されたチェスのグランドマスターや将棋の竜王がAIに負ける場面を目撃した。それを現実のものとして受容するのにも時間がかかった。
道具としてのスマホは生活のなかで手放せないものになり、Siriを話相手にし、コンピュータに縁のなさそうな人でも「まあ、ホームページくらいは自力で見られるようになった。QRコードでもアクセスできるしな!」という状況に至った。
社会全体がコンピュータが周囲にある環境を、コンピュータが言語を操るサービスを、コンピュータを操作する技法を、少しずつ少しずつ学び積み上げてきたのである。それが閾値を超えたところにChatGPTがもたらされたのだ。
ChatGPTが優れているのはもちろんだが、2003年にセカンドライフが登場してもメタバースとは呼ばれなかったように、20年前にChatGPTが現れても人々はそれを使いこなせなかっただろう。長い時を経てChatGPTを受け入れられるほどに、人々はリテラシーを育んできたし、コンピュータに囲まれた環境に馴染んできたのである。(続く)