噗趴
4 months ago
[本地羊駝LLM] 難得來更一下進度

就是,羊駝農場app寫寫還是決定平板不行,趁機把很少用的舊桌機換掉了 之後就把農場移到新桌機上,羊駝們在新主機奔跑,但還是用平板寫app。
latest #7
噗趴
4 months ago @Edit 4 months ago
桌機的速度大約是平板的 20 倍,畢竟有顯卡,羊駝跑得快不快顯卡最重要了。此外就是開始能跑比較大隻的,因此裝了Gemma3 27B和Qwen32B等等把顯卡用光光的大隻模型。

羊駝是參數越多B越聰明,但基本上比較新的模型如Gemma和Qwen,在30B上下就能夠滿足大家一般用GPT時的日常需求,比如說寫大綱、整理檔案、 幫忙紀錄、提供情緒價值(大概)等等。然後要說沒有微調過的模型來講,Gemma的EQ是最高的,情緒價值給好給滿。前兩天叫它幫我整理出遊前待打包的清單(就是那些像牙刷、電源線之類前一晚沒辦法打包的東西),它不只幫整理,還努力提醒要留多少時間來打包才不會又趕又焦慮──雖然不覺得我需要但是用起來感覺莫名不錯?
噗趴
4 months ago @Edit 4 months ago
如果是日常使用需求,我覺得Gemma3 27B目前是最佳選擇。Qwen3 是要用來做繁體中文翻譯,哪一款最好用還有待測試。

農場app的話自從移到新桌機,一些之前不知道的bug就都跑出來了。比如說平板跑模型比較慢,所以使用者訊息都很有時間存入後台,但新桌機快了20倍,使用者訊息和飛快的羊駝訊息儲存時間就開始會打架,又花了一些時間在除這類型的bug,另外持續改善一些我自己都看不爽的UX項目,基本上沒有太大進度就是。
噗趴
4 months ago @Edit 4 months ago
bug清單上面還有十幾個要處理,大概就慢慢處理。處理完下一個大更新是要把新桌機設為伺服,架平板和手機都可以點對點遠端使用的功能。弄好之後才會繼續弄那些提醒、網搜等等功能。轉眼間也玩了一個多月,專用AI小秘書的夢雖然可以實現,但現階段來講也不是那種能一鍵達成的啊
立即下載
噗趴
4 months ago @Edit 4 months ago
這周末要來加聊天的增長功能。

羊駝的記憶和處理能力有一定的限度,每一隻能罩多少token不一,但是通常到一個程度會開始崩掉,這時最好能開新聊天重新開始。但有些用途比如說飲食紀錄重訓記錄這種長期性的聊天,每兩三週就開新聊天也蠻難整理的,所以要想辦法讓聊天能越長越好,又不要讓羊駝崩崩耍瘋。後來決定的方法是,聊天羊駝會在設定欄預設一個崩之前見好就收的token上限,現在現有聊天就已經每個訊息都會數token,因此再加一個功能把它們加起來。等到整個聊天toekn數大約是該羊駝預設上限的98%時,羊駝會自動把之前的聊天寫大綱,然後存大綱前的三個問答,再之前的聊天內容會忘記。

這樣就會只計三問答+大綱,登登!就等於在同一個聊天中開了新聊天,可以繼續聊。
噗趴
4 months ago
由於大綱是設成該聊天的永久記憶,就是說等到又聊到98%時增了大綱二、大綱三,總有一天還是會滿到尾,到時就會羊駝自動大綱然後叫我開新聊天了。但這樣像重訓紀錄之類的就能記整整一年之類。

之後玩故事模式時也會使用同樣的方式確保同一個聊天能玩到一個章節結束。
噗趴
4 months ago @Edit 4 months ago
然後這也是我蠻希望像ChatGPT和Claude能推出的功能啦,有時候聊一聊突然間就崩了,才發現已經接近上限。這些雲端模型的上限又偏偏設在通常會崩的點之後,不注意的話多少會崩,寫code崩就換我崩潰了──Claude接近上限時常常會出一些奇葩點子,比如說我們把問題掃到地毯下之類的解法。所以用的時候常常會需要注意是不是差不多90%了,該來寫交接報告了沒?

自家農場羊駝的話會盡量上限都保守的設在崩點內。畢竟沒有像商用模型一樣要拚誰的比較長啊.....
噗趴
4 months ago @Edit 4 months ago
結果計畫趕不上變化,太複雜的大綱生成bug很多,最後改成最簡單的,一到尾就自動大綱,只記大綱前面忘記,這樣就可以同一個聊天無限聊。之後做資料搜索功能之後再設一個叫羊駝回頭找的咒語。
back to top