Coding白痴的我,今天改了一整天我流翻譯模型RAG流程code的心得:
latest #13
Gemini比我還白痴,要改code請去問CLAUDE。

為了兼顧效能和不要爆出記憶體,調了一整天
結果早上買的600單位,現在燒掉快60單位...orz
目前調出來算是比較平衡穩定的參數
⚙️ RAG 翻譯參數配置
==========================
📚 RAG 檢索:
• 最大術語數: 20
• 最大範例數: 1
• 最低相似度: 0.4
🤖 模型生成:
• 最大 token 數: 512
• 溫度: 0.2
• Top-P: 0.2 • Top-K: 10 ⚡ 批次處理: • 批次大小: 24 • 檢查點間隔: 48
然後發現CLAUDE也很懂得諂媚人類,print出來的東西都會塞一些繪文字。
因為據說人們看到這種code比較容易會給讚。
久而久之,AI就懂得怎麼為自己爭取高評分
Gemini 2.5 Pro coding比較聰明, 不過通常還是需要來回幾次更新條件來修正程式, 一開始就很明確的定義好所有規格的話可以少來回幾次
Claude可能學了不少程式範本,叫他改程式的理解能力很強,而且給它規格說我用A100,他會想辦法壓榨記憶體
back to top