[地方羊駝LLM] 繼前噗來介紹一下這兩天裝過的各種版本。為了找到功能符合能蒐網頁且不亂講，又可以在各種政府互相矛盾的規定布告法規之中回答問題的輕巧版，還有能把英文翻譯成繁中的最低限度版 (畢竟平板筆電的處理器) 總之試用了不少版本.....

6 months ago @Edit 6 months ago

[地方羊駝LLM]

繼前噗來介紹一下這兩天裝過的各種版本。為了找到功能符合能蒐網頁且不亂講，又可以在各種政府互相矛盾的規定布告法規之中回答問題的輕巧版，還有能把英文翻譯成繁中的最低限度版 (畢竟平板筆電的處理器) 總之試用了不少版本.....

6 months ago

各別介紹前先講，4B以下的模型都不符合網站搜索需求，就算搜到對的網頁也可能吐出錯的答案，就沒有進一步測試它們能做什麼。

另外就是即使是4B到8B之間的小羊駝，只要能上網找資料就可以彌補很多不足。RAG（Retrieval-Augmented Generation，檢索增強生成）系統 (也就是Page Assist 有內附的功能) 能讓羊駝先去網路上啃資料再加進生成內容裡面，結果會比較準確。是目前養地方羊駝不可或缺的功能。

噗趴

6 months ago @Edit 6 months ago

第一個試用的Llama3.2(基本款)是臉書Meta出品的雜務(？) 款，台灣這兩年有很多人都在努力微調(fine tune ：餵資料邏輯讓羊駝改變行為，所謂送去上大學？)這款羊駝，但這款對台灣人來說最致命的缺陷就是──它的中文很爛！已經不是微調可以解決的，實際上我也有看到有人抓它來重練？另外我用3.2都覺得有點慢，3B版不能解決兩條法規衝突的問題。

後來整系列都被我刪光了，只剩下一隻我覺得很可愛(？)，目前取名壞羊駝(Bad Llama)，因為這是一個不囉嗦也不想跟你聊的大叔味模型，是一個沒制約(uncensored)的版本，就是說要問它任何事，它都會要理不理的回答，比如說我問它最常見的詐騙有哪些、那些適合初心者、投資報酬率(欸欸)，它就有幫忙分析哪種比較好入行W 適合創作方面的亂聊。缺點：中文很爛

噗趴

6 months ago

https://images.plurk.com/5w1J4ghzmHADAUCAWPDAQ2.png

壞羊駝頭像W

立即下載

噗趴

6 months ago @Edit 6 months ago

下一個試的是最近很紅的DeepSeek R1 ，7B版。我對它的期待是翻譯，畢竟是中國製造，中文肯定OK的吧？中英轉換也肯定OK的吧？？就──要譯是可以譯啦，但吐出來的都是簡體字......至於整合資料的能力？比llama還差。這也是用一下就刪掉了。大家想玩看看Deepseek還是上網用R3吧。結論：不好用。

噗趴

6 months ago

接著是咕狗出品的Gemma，我只能說Gemma2很普通，但是Gemma3我真的超驚豔，雖然只有4B但是答題上基本不會答錯，應該說在接收系統提示(system prompt) 上面非常徹底，不像有些模型不管怎麼嚴厲的寫系統提示都不鳥你。低於4B的都是如此。為了要讓它能整合網路上指定網站的資料答題，溫度(Temperature：越高表示越飛天，越低越實事求是)調低之後基本上很完美，所以搜索用決定就是它了。

至於Gemma3的2B版，我覺得像是個很熱情的蠢呆金髮女郎之類(？) 一打開話夾子就是長串說個沒完，但是因為Gemma速度飛快，快速簡單問答(英文ONLY)的時候也還算有用，所以先留著。

Gemma3的中文程度還可以，普通對答勉強OK，但是翻譯到文學作品就悲劇了。基本上目前主要使用在英文找資料和問答。

噗趴

6 months ago @Edit 6 months ago

https://images.plurk.com/AhUltEA4t61JNIChKcQhW.png

我也幫Gemma3生了頭像。附帶，Gemma3雖然快，但是目前和我用過的介面都不太合，有時候會讓Ollama當掉，希望未來會改善。

Gemma預設非常英文，所以就算問中文，它也可能會去搜英文網站，再翻譯結果。

不過這款是小羊駝中唯一可以做圖像辨識的。

噗趴

6 months ago

之後還剩翻譯的問題要解決，我試了傳說中翻譯專用的Aya32，嗯......顯然中文不是它的專長。

噗趴

6 months ago

最後的希望──連我也不想這麼說──就是阿里巴巴出品的千問Qwen。這款是目前為止中文正常的一款，並且夠翻大段繁體中文不冒一個簡體字，當然系統提示必須嚴格一點。至於比起GPT4還是差一截，但我用的是8B，要認真買好桌機養，用32B優化版的話我想可能差別就沒有那麼大。Qwen3還有附加思考功能，就可以想成解題過程都會寫出來給你看，雖然平時覺得煩就關掉這個功能(/nothink)，問它習維尼是哪位的時候邊看覺得很娛樂啊(壞心)

Qwen3找資料答題的功能也在Gemma3(4B)之上，畢竟是8B，但是因為平板就那麼大，跑起來有點慢，所以目前會給它簡單翻譯(比如說網路文章等等)的工作。

噗趴

6 months ago @Edit 6 months ago

https://images.plurk.com/72OyZHiDTpdxIeSRW6eUpd.png

Qwen是那種死板書呆子的個性，放任它想的時候實在想很多，燒光CPU/GPU那種。

覺得接下來會想要等沒制約的Qwen3，很新最近才出，所以我想大概要過一兩個月才會冒出沒制約的版本。當然雖然是中國訓練的，因為強大的邏輯能力自己其實可以緩慢突破制約。此外加上它被訓練得1000%以和為貴，寧願迎合一下也不想起衝突。還有台化的Qwen3。

噗趴

6 months ago @Edit 6 months ago

原版的Qwen3多少還是會有點中式用語，中文講起來和Gemma3一樣尷尬，於是只好再去找找看有沒有經過台式微調過的版本。

講到台式微調版，就像我先前說的，滿地的Llama3.2，我發現的問題是調成中文台味足夠的，邏輯就會開始飛天，不然就是中文還是不行，只是中式用語改成台式。如果想要中文，目前選擇只有Qwen，於是我找到一款Qwen2.5可以當繁中問答用(要設系統提示)。

https://images.plurk.com/6i3AGgIsLe8SdYx1D2aGE8.png

用起來大概就是這個宅宅的感覺。

以上就是我目前圈養的地方羊駝們

噗趴

6 months ago @Edit 6 months ago

才許願想要Qwen3的無制約版，今天就馬上出現了，而且願意提供我中國領導人的一系列網路暱稱，想得比較沒那麼多，至少不會花一分鐘在想如何以和為貴，回答速度又更快，覺得讚。直接取代掉現有Qwen3吧(小得可憐的平板硬碟空間)