要回到「主動學習」與「智能體」本質。這也就是所謂的強化學習(Reinforcement Learning, RL)和 agent-based AI 技術架構。
Richard Sutton 的批判,並不只是網路社群上流傳的聳動標題,而是建立在他數十年深耕強化學習(RL)、智能體(agent-based AI)與終身學習領域的理論積澱。他直指,大語言模型(LLM)所展現的強大語言生成能力,本質上仍是「高階模仿」,而非真正的世界理解或自主創新。
精選解讀|強化學習之父 Sutton 為何斷言 LLM 是「走不通」?