専門用語なし！ChatGPTの仕組みを分かりやすく解説！

2023-02-262023-06-07

自然な会話ができ、物知りなことで話題になっているChatGPT。今回はこれの仕組みを分かりやすく解説します。専門用語はできるかぎり使いません。難しい部分は省略しているので、正確な説明でないことをご了承ください。

この記事を読むと分かること

なぜChatGPTは様々な知識を持っているのか
なぜChatGPTは嘘をつくのか
なぜChatGPTは最近の出来事を知らないのか
なぜChatGPTは英語の方が得意なのか
なぜChatGPTは自然な会話ができるのか

ChatGPTの基本

まずはChatGPTの基本から押さえていきましょう。

基本は言葉の連想ゲーム

ChatGPTの仕組みの基本は言葉の連想ゲームです。与えられた文の次には、どんな言葉がくるのか？をChatGPTは考えています。例えば、「日本で一番」と入力したとしましょう。その後に続く単語は何でしょうか？

入力した文	後に続くと予想する単語	後に続く確率
日本で一番	有名な	45%
	高い	40%
	臭い	15%

文の次に続く単語を考える例

この場合には、あとに続く確率が最も高い「有名な」を選択します。そしてまた、あとに続く確率の高い単語を選ぶ。この繰り返しで文章を作ります。これは、ChatGPTが嘘をつく原因にも繋がります。ありそうな単語の組みあわせで文章を作った結果、デタラメになってしまうということですね。

最も確率の高い言葉だけを選び続けると、毎回同じ回答を返す単調なモデルになってしまいます。なので、確率の低い言葉をあえて選ぶ場合もあります。ChatGPTに同じ質問をしても、毎回異なる回答になるのはこれが原因です。

学習データは何？

ChatGPTの学習データはインターネットの文章や電子書籍などが使用されています。主なデータはインターネット上の文章。ただし、ネット上には誹謗中傷を含む文章や、文法の汚い文章などが散在しています。そのような文章を取り除いて、良質な文章のみを学習データとしています。

そのため、次のような特徴があります。

最近の出来事が分からない: 学習データは2021年末時点での物になっていますので、最新の情報は分かりません。今の総理大臣を聞いても間違った回答になります。
英語の方が得意: 学習データは英語が多いので、日本語よりも英語の方が質の良い回答であることが多いです。

この仕組みの問題点

この仕組みの問題は、次の通りです。

回答が人間の好みと一致しない
信頼性の低い回答や有害な回答をしてしまう恐れがある
表現を砕けたものにすると、意味が理解できず筋違いな回答を生成することがある

ざっくりまとめると、自然な会話ができないということです。この問題点を解決するため、次章のような仕組みが出来ました。

自然な会話ができる仕組み

学習データによる言葉の連想ゲームだけでは、自然な会話ができないことが分かりました。では、どのように解決すればよいでしょうか。簡単に説明すると人間が直接よい会話のパターンを教えます。これには大きく分けて3つの工程があります。

1. 人間がよい会話のお手本を教える

1つ目の工程は、人間が自然な会話のパターンを沢山用意し、ChatGPTに教えていきます。例えば「Aと聞かれたらBと答えましょう」といった内容です。

2. 人間がAI先生に採点基準を教える

2つ目の工程は、ChatGPTの回答を人間が☆を付けて採点するという内容です。シンプルな仕組みを採用するなら、ChatGPTが回答した文章を人間が採点し、その結果をChatGPTに伝える、ということを繰り返したいところです。しかし、膨大な回数をこなさなければならないので人間が大変です。また、複数人の人間を用意して採点すると、採点基準がぶれてしまうかもしれません。なので、人間の代わりにChatGPTの採点をする「AI先生」を育てます。

3. ChatGPTとAI先生でひたすら学習させる

AI先生を育て終わったら、ChatGPTとAI先生で、よい点数が取れるようになるまでたくさん学習を続けます。

まとめ

このページでは、ChatGPTがどのようにして文章を生成しているのか、様々な知識を持っているのか、自然な会話を実現しているかについて説明しました。最新の技術と、人間による泥臭い手作業が合わさって、このような技術が作られています。

お願い

このページは様々なWEBサイトを参考にして制作させて頂きました。私は言語処理の専門家ではありませんので、間違いなどがあればTwitterや問い合わせから教えて頂ければ幸いです。

参考サイト

自民党AIの進化と実装に関するプロジェクトチーム｜衆議院議員　塩崎彰久（あきひさ）｜note

https://gigazine.net/news/20230222-why-chatgpt-work/

https://qiita.com/omiita/items/c355bc4c26eca2817324

https://atmarkit.itmedia.co.jp/ait/articles/2301/13/news023.html

このページの説明と専門用語の対応

言葉の連想ゲーム	言語モデル
自然な会話ができる仕組み	InstructGPT
人間がよい会話のお手本を教える	教師あり学習
AI先生	報酬モデル
ひたすら学習	強化学習