今天试了一下用 Ollama 在本地跑大模型。

安装

官网下载安装包,一条命令就装好了:

ERROR:(B This script is intended to run on Linux and macOS only.

跑模型

我服务器配置低,选了个小模型 qwen2.5:1.5b:

第一次运行会自动下载模型,1.5b 的模型大概 1GB 左右。

效果

跑起来还行,就是有点慢。问了一些简单的问题,回答质量还可以,比预期好。

不过问复杂一点的问题就开始胡说八道了,毕竟是 1.5b 的小模型,不能要求太高。

遇到的问题

内存不够用的时候会卡死,得把其他服务停掉。看来以后得升级服务器了。

下一步

想试试微调,但感觉硬件不太够。先了解一下原理吧。