モデル | ページ 3

ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(2/2)

１．ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(2/2)まとめ・現在のChatGPTにはまだ制限があり不正確または無意味な答えを書くことがある・不明瞭な質問の意図を聞きなおす事も稀でユーザーの意図を推測す...

2022.12.06

モデル

１．ChatGPT:フェルマーの小定理をテーマに五行詩を作ってみせる言語モデル(1/2)まとめ・OpenAIがChatGPTと呼ばれる対話形式で会話可能なモデルを公開・ChatGPTは追加の質問に答えたり、不適切な要求を拒否する事が可能...

2022.12.05

モデル

１．Flan-U-PaLM:わずかな追加計算で大規模言語モデルの性能を向上(2/2)まとめ・指示微調整とは指示形式で表現されたデータセットでLMを微調整する事・指示微調整は1800タスクで実施し場合でもわずかな計算量しか必要としない・...

2022.12.02

モデル

１．Flan-U-PaLM:わずかな追加計算で大規模言語モデルの性能を向上(1/2)まとめ・巨大言語モデルを学習させるためには膨大な計算資源を必要でハードルが高い・膨大な計算資源を使わずに既存モデルを大幅に改善する2つの手法を提案・U...

2022.12.01

モデル

１．Expert Choice：大規模なMoEモデルを偏らせずに学習させる工夫(2/2)まとめ・密なFFNにMoEとゲーティング機能を適用するのはFFNが重い処理であるため・エキスパートが受け入れるトークン数に上限を設けるとスコアは1ポ...

2022.11.20

モデル

１．Expert Choice：大規模なMoEモデルを偏らせずに学習させる工夫(1/2)まとめ・MoEは巨大モデル内のFFレイヤーを複数の同じFFレイヤーに置き換える事・MoEとスパース設計を組み合わせる事で効率的なデータ処理が可能にな...

2022.11.19

モデル

１．ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(2/2)まとめ・ReActの軌跡を用いてより小さな言語モデルの微調整を行うことも検討中・ReActが推論を誤った際、人間が道筋を編集...

2022.11.14

モデル基礎理論

１．ReAct:わからなかったらググって、ググった情報を元にもう一度ググって必要な情報を探せる人工知能(1/2)まとめ・言語モデルは様々なタスクに応用されているが学習済の知識しか利用できない・また、長期的な視点にたって行動するための一時...

2022.11.13

モデル基礎理論

１．AudioLM：スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(2/2)まとめ・AudioLMの学習データは生のオーディオのみで文書化されたデータは未使用・人間の評価者は人間の音声とAudioLMの生成音声の見分けがつ...

2022.10.12

モデル

１．AudioLM：スピーチの続きもピアノの続きも生成可能なオーディオ言語モデル(1/2)まとめ・オーディオ言語モデルは文章ではなくオーディオを使って学習した言語モデル・GPT-3のような言語モデルが出来る事がオーディオを使ってできるモ...

2022.10.11

モデル

１．LFNRとGPNR：反射するCDを含む場面の視線合成が可能な新手法(2/2)まとめ・LFNRの制限の1つは狭い範囲から情報を取得しているため汎化できない事・GPNRでは同じ深度のポイント間で情報を交換するtransformerを追加...

2022.10.01

モデル基礎理論

１．LFNRとGPNR：反射するCDを含む場面の視線合成が可能な新手法(1/2)まとめ・ある風景の複数の写真から新しい視点を合成する視点合成タスクは長年の課題・LFNRではCDの光彩のような視点に依存する効果を再現する課題に取り組んだ ...

2022.09.30

モデル基礎理論