噗趴
4 months ago
[本地羊駝LLM] 被我放棄的翻譯繁體中文這塊,終於在買新桌機之後重啟
噗趴
4 months ago @Edit 4 months ago
之前尋找繁體中文翻譯(與閒聊)的語言模型時,主要是放在中國製造的模型上,因為之前用筆電時,最大的模型只能玩到14B,而那種大小的模型繁中翻譯上基本上都不適用。唯一勉強可用的是Qwen3 14B,畢竟它算是中文訓練的模型,但重點就放在它──因為用百度訓練,所以常識......世界觀......主要的戰鬥是用力規定它不准吐出簡體字。

現在因為有顯卡,能用比較大的模型Gemma3 27B ──這時候中文也OK了,雖然譯起來有點像進階版的咕狗翻譯──稍嫌生硬,有些地方的翻譯理解會有誤,風格上並沒有GPT那麼多樣,但是要比較起來:GPT省字太嚴重,有時懶到令人憤怒 (這也是因為要省字省Token,OpenAI 認知到一般人根本不想知道翻譯文章的每個細節,所以我想系統提示是越簡略越好,所謂COSTDOWN)
噗趴
4 months ago
本地羊駝我可以全面控制系統提示,因此只要指示字句照實翻譯就可以了。Gemma的翻譯比較粗糙,逐字對是比GPT的超省字版快。

生成的速度也非常快,兩段兩段譯的話只要幾秒就出現了,體感瞬間飆速。而且因為能夠控制系統提示,可以逐段讓它更正。GPT雖然也可以,但改多了會變ADD忘記之前在幹嘛,因為它每次都會在訊息結尾給你三個選項希望你跟它一起ADD嘛,這時候又要再度提醒它咒語 (存在Project底下的那個)。Gemma的好處是會一直問說這樣改OK嗎?OK的話我們要不要繼續翻譯,比較專注於手邊工作。
噗趴
4 months ago
例句:Creative professionals have long found themselves amid an existential crisis in a market where profits are slim and the vast majority of them will not make a living wage solely from their art. Those matters have become exacerbated tenfold by the speedy implementation of generative-AI technology within their spaces.
立即下載
噗趴
4 months ago @Edit 4 months ago
Gemma:在這利潤微薄、絕大多數人靠藝術勉強度日都困難的市場,創意工作者長期以來處在生存危機中。這些問題因為生成式人工智慧技術在他們的領域中快速施用而加劇十倍。

GPT:
創意工作者原本就在微薄利潤中掙扎求生,而生成式 AI 的迅速滲透使這場生存危機加劇十倍。
噗趴
4 months ago @Edit 4 months ago
我覺得一個程度的潤飾OK,最近GPT應該是翻譯+壓縮成一半長度......

綜合整理來說本地羊駝沒有比較快,工人智慧介入程度都是差不多的,但是我自己認為刪字比補字快啦。底線是,至少我知道放進去什麼羊駝會吐出什麼