専門用語なし!ChatGPTの仕組みを分かりやすく解説!

AIと虫眼鏡

自然な会話ができ、物知りなことで話題になっているChatGPT。今回はこれの仕組みを分かりやすく解説します。専門用語はできるかぎり使いません。難しい部分は省略しているので、正確な説明でないことをご了承ください。

目次

この記事を読むと分かること

  • なぜChatGPTは様々な知識を持っているのか
  • なぜChatGPTは嘘をつくのか
  • なぜChatGPTは最近の出来事を知らないのか
  • なぜChatGPTは英語の方が得意なのか
  • なぜChatGPTは自然な会話ができるのか

ChatGPTの基本

まずはChatGPTの基本から押さえていきましょう。

基本は言葉の連想ゲーム

ChatGPTの仕組みの基本は言葉の連想ゲームです。与えられた文の次には、どんな言葉がくるのか?をChatGPTは考えています。例えば、「日本で一番」と入力したとしましょう。その後に続く単語は何でしょうか?

入力した文後に続くと予想する単語後に続く確率
日本で一番有名な45%
高い40%
臭い15%
文の次に続く単語を考える例

この場合には、あとに続く確率が最も高い「有名な」を選択します。そしてまた、あとに続く確率の高い単語を選ぶ。この繰り返しで文章を作ります。これは、ChatGPTが嘘をつく原因にも繋がります。ありそうな単語の組みあわせで文章を作った結果、デタラメになってしまうということですね。

最も確率の高い言葉だけを選び続けると、毎回同じ回答を返す単調なモデルになってしまいます。なので、確率の低い言葉をあえて選ぶ場合もあります。ChatGPTに同じ質問をしても、毎回異なる回答になるのはこれが原因です。

学習データは何?

ChatGPTの学習データはインターネットの文章や電子書籍などが使用されています。主なデータはインターネット上の文章。ただし、ネット上には誹謗中傷を含む文章や、文法の汚い文章などが散在しています。そのような文章を取り除いて、良質な文章のみを学習データとしています。

学ぶ人工知能

そのため、次のような特徴があります。

最近の出来事が分からない

学習データは2021年末時点での物になっていますので、最新の情報は分かりません。今の総理大臣を聞いても間違った回答になります。

英語の方が得意

学習データは英語が多いので、日本語よりも英語の方が質の良い回答であることが多いです。

この仕組みの問題点

この仕組みの問題は、次の通りです。

  • 回答が人間の好みと一致しない
  • 信頼性の低い回答や有害な回答をしてしまう恐れがある
  • 表現を砕けたものにすると、意味が理解できず筋違いな回答を生成することがある

ざっくりまとめると、自然な会話ができないということです。この問題点を解決するため、次章のような仕組みが出来ました。

自然な会話ができる仕組み

学習データによる言葉の連想ゲームだけでは、自然な会話ができないことが分かりました。では、どのように解決すればよいでしょうか。簡単に説明すると人間が直接よい会話のパターンを教えます。これには大きく分けて3つの工程があります。

1. 人間がよい会話のお手本を教える

1つ目の工程は、人間が自然な会話のパターンを沢山用意し、ChatGPTに教えていきます。例えば「Aと聞かれたらBと答えましょう」といった内容です。

人間がChatGPTに会話のお手本を教える
人間が会話のお手本を教える

2. 人間がAI先生に採点基準を教える

2つ目の工程は、ChatGPTの回答を人間が☆を付けて採点するという内容です。シンプルな仕組みを採用するなら、ChatGPTが回答した文章を人間が採点し、その結果をChatGPTに伝える、ということを繰り返したいところです。しかし、膨大な回数をこなさなければならないので人間が大変です。また、複数人の人間を用意して採点すると、採点基準がぶれてしまうかもしれません。なので、人間の代わりにChatGPTの採点をする「AI先生」を育てます

AI先生に採点基準を覚えさせる
AI先生に採点基準を覚えさせる

3. ChatGPTとAI先生でひたすら学習させる

AI先生を育て終わったら、ChatGPTとAI先生で、よい点数が取れるようになるまでたくさん学習を続けます

ChatGPTとAI先生でひたすら学習させる
ChatGPTとAI先生でひたすら学習させる

まとめ

このページでは、ChatGPTがどのようにして文章を生成しているのか、様々な知識を持っているのか、自然な会話を実現しているかについて説明しました。最新の技術と、人間による泥臭い手作業が合わさって、このような技術が作られています。

お願い

このページは様々なWEBサイトを参考にして制作させて頂きました。私は言語処理の専門家ではありませんので、間違いなどがあればTwitterや問い合わせから教えて頂ければ幸いです。

参考サイト

自民党AIの進化と実装に関するプロジェクトチーム|衆議院議員 塩崎彰久(あきひさ)|note

https://gigazine.net/news/20230222-why-chatgpt-work/

https://qiita.com/omiita/items/c355bc4c26eca2817324

https://atmarkit.itmedia.co.jp/ait/articles/2301/13/news023.html

神戸のデータ活用塾!KDL Data Blo...
ChatGPTを速報解説してみた - 神戸のデータ活用塾!KDL Data Blog 今話題のChatGPTを解説して、実際に使ってみました!
どこから見てもメンダコ
安全で信頼できる対話AIのためのアプローチ:InstructGPT, Sparrow, Galactica - どこから見てもメンダコ OpenAIのInstructGPT, DeepMindのSparrow, MetaのGalacticaにおける対話AIの信頼性/安全性向上のためのアプローチをまとめます Words have the power to both destroy and ...

このページの説明と専門用語の対応

言葉の連想ゲーム言語モデル
自然な会話ができる仕組みInstructGPT
人間がよい会話のお手本を教える教師あり学習
AI先生報酬モデル
ひたすら学習強化学習
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

元プログラマーのパソコンオタク。ChatGPTをきっかけにAIの凄まじさを認識し、ブログで情報発信を行う決意をする。基本インドアだが稀に山を登りごく稀にキャンプをする。

目次