LM Studio 這陣子操下來
只能說,大 VRAM 才有人權
20B 模型會發生模型卸載,CPU 能正常輸出,但速度不快,強制 GPU 的話 Queue 會炸掉
7B 模型,可以完全交給 GPU,速度很快,但品質令人堪憂