大模型要變聰明,得靠人教人管——這就是 Human-in-the-loop RL。



我最近在 @JoinSapien 上做了個任務,是審一段AI寫的推理過程:

🌱 AI是怎麼想的?
🌱 合不合邏輯?
🌱 哪一步開始歪了?

這種任務叫 CoT(Chain-of-Thought)評估,我就是它的邏輯審計員。

再進一步,還有 Tree of Thoughts(樹狀推理路徑),AI會嘗試多個想法分支,人類來篩哪條路徑最好。

其實你可以當做你在給一個小孩講題,但這小孩是GPT級別的未來大腦。

這活,AI自己幹不了,人必須參與。

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol
TREE-6.92%
GPT-4.69%
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)