OpenAI社の次世代モデルGPT-5に何が期待できるか?リリース前に事前に把握したいChatGPTのモデル特徴
- 2024.09.03
- ChatGPT
大規模言語モデル(LLM)に関心のある人は、OpenAIのGPTシリーズの最新バージョンも気になっているかと思います。今年は、特にGPT-4 TurboとGPT-4o/Omniが話題になりました。GPT-4 Turboは精度が向上し、GPT-4o/Omniは推論能力が強化され、音声やオーディオにも対応できるようになりました。
1〜2年ごとに新しい主要モデルをリリースしてきたOpenAI社のペースを加味すると、OpenAI社がGPT-5のリリース日は、今年末か来年初頭には発表すると予想されています(噂によると、Project Orion(別名GPT-5)の初期バージョンが今年の秋にも登場する可能性があるとのことですが、OpenAIのこれまでの動きを考えると、2025年の予想が濃厚)
※記載内容はあくまでも世間の予想を元にまとめた内容をご了承の点読んでください。
ダブルローンチ:Project StrawberryとProject Orion
内部関係者2人によると、OpenAIの次のリリースには、Project Strawberry(プロジェクト・ストロベリー)とProject Orion(プロジェクト・オリオン)という2つのモデルが関連しているようです。前者は推論の問題に取り組む全く新しいタイプのモデルです後者は、GPT-4の実際の後継モデルです。
Project Strawberry(プロジェクト・ストロベリー)とは?
以前はQ*として知られていたProject Strawberryは、OpenAIの最も秘密性の高いプロジェクトです。最新の情報によると、このモデルの簡易版が早ければ今年の秋にも登場する可能性があり、以下のことが期待されています。
- これまで見たことのない新しい数学の問題を解く
- 回答を計画する際に「深く考える」時間を取る
- 応答速度のニーズに応じてオン/オフを切り替えられる高度な推論機能を提供する
Project Orion(プロジェクト・オリオン)とは?
Project Orionは、OpenAI社の次期代表的なモデルになると期待されています。GPT-5が直接インターネットデータだけでなく、Project Strawberryによって生成された合成データでもトレーニングされているようです。
もっと噛み砕いた説明を生成AIに回答生成してもらったので以下をご確認ください↓
(Gemini1.5Pro)
Project StrawberryとProject Orionの関係を分かりやすく説明するために、例え話を使いましょう。
Project Strawberryは、図書館の司書のようなものです。Project Orionは、図書館で調べものをしたい学生のようなものです。
Project Orionは化学についてもっと知りたいと思っています。しかし、インターネット上には情報があふれていて、どれが本当に必要な情報なのか、見つけるのは大変です。
そこでProject Strawberryの出番です。Project Strawberryは、インターネットという広大な図書館の中から、化学に関する重要な情報を選び出し、分かりやすく整理します。そして、Project Orionが理解しやすいように、要点をまとめた資料を作成します。
Project Orionは、Project Strawberryが作成した資料を読むことで、効率的に化学を学ぶことができます。以前は、インターネットという情報の大海原で、必要な情報を探すのに苦労していましたが、Project Strawberryのおかげで、スムーズに学習を進めることができるようになったのです。
つまり、Project Strawberryは、Project Orionが効率的に学習できるように、情報を整理し、提供する役割を担っているのです。
GPT-5の能力を支えるエンジンの予測
GPT-5がどのように進化するのか、専門家の意見も参考にしながら、3つのポイントに絞って解説します。
1. より賢い推論:まるで思考プロセスが見えるように
最近、LLMに指示を出す「プロンプト」の研究が進んでいます。「Chain of Thought」や「Thinking」ステップといった手法を使うと、LLMはまるで人間のように段階的に考え、より正確な答えを導き出すことができるようになります。
OpenAIは、これらの技術をGPT-5に組み込むことで、ユーザーが意識しなくても、裏側でLLMが思考プロセスを踏んで答えを導き出せるようにする可能性があります。また、複数の答えの候補を比較検討し、最適なものを選ぶ機能も期待されています。
2. 間違いを認識する能力:自信を持って回答
LLMは時に間違った情報(ハルシネーション)を生成してしまうことがあります。これは「創造性」の裏返しでもあるため、完全に無くすことは難しいでしょう。
そこで重要になるのが「Logprobs」という機能です。これは、LLMがどれくらい自信を持って回答しているのかを示す指標です。GPT-5では、このLogprobsが標準機能として搭載され、ユーザーはLLMの回答の信頼度をより簡単に確認できるようになるかもしれません。
3. マルチモーダル能力の向上:画像やPDFも理解
GPT-4oでは、画像やPDFのデータ利用に制限がありましたが、GPT-5ではこれが大幅に改善される可能性があります。OpenAIは、GPT-4oで得られたデータを利用して、GPT-5のマルチモーダル能力(画像や音声など、複数の種類の情報を扱う能力)を向上することが期待されています。
引き続き、GPT-5で期待されている機能は、コンテキストウィンドウの拡大、推論能力とマルチモーダル機能の向上、ハルシネーションの減少、より低価格で精度が向上が期待されています。
GPTリリースの簡易的なタイムラインをリフレクト:
年 | モデル名 | 特徴・進展内容 |
---|---|---|
2018 | GPT-1 | 初のGPTモデル。基本的な自然言語処理能力を持つ。 |
2019 | GPT-2 | 大規模なデータセットでトレーニングされ、より高度なテキスト生成能力を持つ。 |
2020 | GPT-3 | 1750億のパラメータを持ち、非常に高い自然言語処理能力を実現。 |
2022 | GPT-3.5 | GPT-3の改良版。いくつかの性能向上とバグ修正が行われた。 |
2023 | GPT-4 | マルチモーダル機能を持ち、さらに高い精度と推論能力を提供。 |
2023 | GPT-4 Turbo | GPT-4の精度を向上させた高速版。 |
2023 | GPT-4o/Omni | 推論能力と音声/オーディオインターフェースを拡張。 |
2025 (予定) | GPT-5 | コンテキストウィンドウの拡大、推論とマルチモーダル機能の改善、ハルシネーションの減少、精度向上を低価格で実現することが期待されている。 |