InstructGPTで人間のラベラーを使って強化学習させたのがブレークスルーだったんだな。知性はデータに宿っている。

stealthinustealthinu のブックマーク 2024/05/09 20:57

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

ChatGPT�人間のフィードバックから強化学習した対話AI

    東京大学の研究室内で,今井がChatGPTの知見を共有するために使用したスライド資料です. 特に以下のような話題,技術について解説しています. ・ChatGPTの凄さ ・ChatGPT技術 ・言語モデル ・プロンプト ・GP...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう