ChatGPTの急速な変化――『ChatGPTの全貌』刊行記念、特別寄稿 by岡嶋裕史
発売ほやほやの新刊! 電子もあります。
新書の基となった連載はこちら
岡嶋さんの好評既刊
ChatGPTの急速な変化――『ChatGPTの全貌』刊行記念、特別寄稿 by岡嶋裕史
ChatGPTは能力低下している?
ChatGPTは相変わらず急速な変化を続けている。「進歩」と書かなかったのは、ChatGPTの能力が低下しているとの報道が相次いでいるからだ。私が個人として使っている範囲では目に見えた能力低下は感じられないが、個人の観察範囲から得られた印象であって全体に敷衍できるわけではない。
多くの人が共感している以上、何らかの事象は起きているのだろうが、本書にも記したようにOpenAIはソースコードやアーキテクチャを公開しているわけではないので、実際のところ検証不能である。
おそらく……という留保付きで推論するならば、ポリティカルコレクトネスのコードに引っかかる回答やバイアスのかかった回答が生成されるたびにファインチューニングを繰り返しているだろうから、迂回経路が増えてしまって回答精度を落としているかもしれない。あるいは膨大な電力消費に耐えかねて低演算リソースを志向するアーキテクチャに移行させている可能性もある。
いずれにしろ、日々何らかの変更が加えられている点において、ChatGPTは使いがいのあるサービスである。連載をしていた時期と比べても、ChatGPT Plus(有償サービス)限定だがプラグイン、コードインタプリタといった機能が追加されている。
プラグインとはサービスを拡張する機能だが、この場合は第三者企業が作ったサービスをChatGPTに連携させることを指している。たとえばChatGPTは現在情報にアクセスできないので検索用途には向かないが、プラグインで拡張することによって今の情報を検索することが可能になる。
また、本書中で予想した画像生成AIとの結節点になるようなプラグインも、もう出回り始めた。旅行サイト、購買サイトとの連携プラグインもある。プラグインの品質にはバラツキがあるが、プラグイン機能がリリースされたことでサードパーティーがChatGPT市場に参入しやすくなり、開発競争が加速するだろう。ChatGPTを中心に、グーグルが検索エンジンで作ったようなエコシステムが形成されると思う。
コードインタプリタはPython(プログラミング言語)の作成と実行を行う機能である。作成は従来サービスでもある程度やってくれたが、実行はしてくれなかった。コードインタプリタを使えば、わざわざ別の実行環境を用意する必要はなく、やたらと生産性が上がる。
ファイルのやり取りが可能
ただ、すごく便利なのはむしろChatGPTとファイルのやり取りができるようになったことかもしれない。
プログラムを書いてファイルに保存し、それをChatGPTに送って実行してもらうことができる。簡単な文法エラーならChatGPTが指摘・修正してくれる。
png形式で保存された写真ファイルをアップロードして、jpeg形式で送り返してもらうことなども可能だ。
オープンデータで有名な鯖江市さんのサイトから、消火栓の位置データをダウンロードしてきた。それをChatGPTにアップロードして、地図上に描いてくれるように頼む。
実行環境上では地図が出来ているのだけれど、直接は見られないので、ファイルとしてダウンロードできるように指示してみた。
ダウンロードして開いてみると、ばっちりである。
初級のデータサイエンスの授業で100分かけてやっていたような内容が、一瞬で組み上がってしまった。もちろん、この背後で何をやっているか理解していないと、結果だけ表示されてもそれを正しく評価・分析できない(むしろ危険。未就学児に棍棒を持たせるようなものだ)ので、勉強しないですむわけではないが、正しい知識を備えた上でコパイとして活用すれば、仕事の効率は高まるだろう。
タイタニック号の生存予測
最後に、機械学習の練習の定番である「タイタニック号のデータから、どんな人が生存できるのかを予測する」タスクを行って結びにしたい。
はじめて見た人のなかには、「えっ、こんなに簡単に分析できるの?」と感動する人もいるだろう。実際、よくできている。しかし、くどいようだがChatGPTの中身はブラックボックスである。美しいようでいて、実は大嘘の結果を出力する可能性は多分にある。理解できない技術を振り回すほど恐ろしいことはない。その点には自覚的になる必要がある。
また、タイタニック号のケースはおそらくChatGPTの学習データの中に含まれていて、チューニングもされている。与えたデータからだけでは、「ほうほうこの列のデータは兄弟姉妹の数を意味しているのですね」とは容易にわからない。ちょっと出来すぎなのだ。
だから、「自分の会社のデータでもやってみよう!」と思ったときに、この例のようにスラスラ回答が出てくるとは限らないので、その点を踏まえて楽しんでいただければと思う。(了)