自然な会話ができ、物知りなことで話題になっているChatGPT。今回はこれの仕組みを分かりやすく解説します。専門用語はできるかぎり使いません。難しい部分は省略しているので、正確な説明でないことをご了承ください。
この記事を読むと分かること
- なぜChatGPTは様々な知識を持っているのか
- なぜChatGPTは嘘をつくのか
- なぜChatGPTは最近の出来事を知らないのか
- なぜChatGPTは英語の方が得意なのか
- なぜChatGPTは自然な会話ができるのか
ChatGPTの基本
まずはChatGPTの基本から押さえていきましょう。
基本は言葉の連想ゲーム
ChatGPTの仕組みの基本は言葉の連想ゲームです。与えられた文の次には、どんな言葉がくるのか?をChatGPTは考えています。例えば、「日本で一番」と入力したとしましょう。その後に続く単語は何でしょうか?
入力した文 | 後に続くと予想する単語 | 後に続く確率 |
---|---|---|
日本で一番 | 有名な | 45% |
高い | 40% | |
臭い | 15% |
この場合には、あとに続く確率が最も高い「有名な」を選択します。そしてまた、あとに続く確率の高い単語を選ぶ。この繰り返しで文章を作ります。これは、ChatGPTが嘘をつく原因にも繋がります。ありそうな単語の組みあわせで文章を作った結果、デタラメになってしまうということですね。
最も確率の高い言葉だけを選び続けると、毎回同じ回答を返す単調なモデルになってしまいます。なので、確率の低い言葉をあえて選ぶ場合もあります。ChatGPTに同じ質問をしても、毎回異なる回答になるのはこれが原因です。
学習データは何?
ChatGPTの学習データはインターネットの文章や電子書籍などが使用されています。主なデータはインターネット上の文章。ただし、ネット上には誹謗中傷を含む文章や、文法の汚い文章などが散在しています。そのような文章を取り除いて、良質な文章のみを学習データとしています。
そのため、次のような特徴があります。
- 最近の出来事が分からない
-
学習データは2021年末時点での物になっていますので、最新の情報は分かりません。今の総理大臣を聞いても間違った回答になります。
- 英語の方が得意
-
学習データは英語が多いので、日本語よりも英語の方が質の良い回答であることが多いです。
この仕組みの問題点
この仕組みの問題は、次の通りです。
- 回答が人間の好みと一致しない
- 信頼性の低い回答や有害な回答をしてしまう恐れがある
- 表現を砕けたものにすると、意味が理解できず筋違いな回答を生成することがある
ざっくりまとめると、自然な会話ができないということです。この問題点を解決するため、次章のような仕組みが出来ました。
自然な会話ができる仕組み
学習データによる言葉の連想ゲームだけでは、自然な会話ができないことが分かりました。では、どのように解決すればよいでしょうか。簡単に説明すると人間が直接よい会話のパターンを教えます。これには大きく分けて3つの工程があります。
1. 人間がよい会話のお手本を教える
1つ目の工程は、人間が自然な会話のパターンを沢山用意し、ChatGPTに教えていきます。例えば「Aと聞かれたらBと答えましょう」といった内容です。
2. 人間がAI先生に採点基準を教える
2つ目の工程は、ChatGPTの回答を人間が☆を付けて採点するという内容です。シンプルな仕組みを採用するなら、ChatGPTが回答した文章を人間が採点し、その結果をChatGPTに伝える、ということを繰り返したいところです。しかし、膨大な回数をこなさなければならないので人間が大変です。また、複数人の人間を用意して採点すると、採点基準がぶれてしまうかもしれません。なので、人間の代わりにChatGPTの採点をする「AI先生」を育てます。
3. ChatGPTとAI先生でひたすら学習させる
AI先生を育て終わったら、ChatGPTとAI先生で、よい点数が取れるようになるまでたくさん学習を続けます。
まとめ
このページでは、ChatGPTがどのようにして文章を生成しているのか、様々な知識を持っているのか、自然な会話を実現しているかについて説明しました。最新の技術と、人間による泥臭い手作業が合わさって、このような技術が作られています。
お願い
このページは様々なWEBサイトを参考にして制作させて頂きました。私は言語処理の専門家ではありませんので、間違いなどがあればTwitterや問い合わせから教えて頂ければ幸いです。
参考サイト
自民党AIの進化と実装に関するプロジェクトチーム|衆議院議員 塩崎彰久(あきひさ)|note
https://gigazine.net/news/20230222-why-chatgpt-work/
https://qiita.com/omiita/items/c355bc4c26eca2817324
https://atmarkit.itmedia.co.jp/ait/articles/2301/13/news023.html
このページの説明と専門用語の対応
言葉の連想ゲーム | 言語モデル |
自然な会話ができる仕組み | InstructGPT |
人間がよい会話のお手本を教える | 教師あり学習 |
AI先生 | 報酬モデル |
ひたすら学習 | 強化学習 |