核對小程式原本打算用llamafile引擎,是全套弄好,不需要自寫後台超方便。但圖片辨識寫好(因為原本要用羊駝1B沒有圖片辨識功能)前台架好,接起來用了之後,又回到我第一次跳本地羊駝坑的撞牆狀態──慢、到、不、行!連我自建小農場app的Gemma3 4B都比那1B快,WHYYYY?
羊駝1B的核對準確度大概80%,勉強不通過,還是得用Gemma3 4B。這個基本上llamafile在我的平板上是一個泥沼中奔跑的速度。於是又回到那個結果還是要用llama.ccp引擎+自建
輕薄好自在後台。
是的,自己重新發明輪子就是因為自己的輪子真的跑比較快啊!嗯,人參