在安装 Ollama 后突发奇想,既然在线源有 Ollama 可选,会不会也能通过在线源安装 LLaMA.cpp 呢?
如此想着就在执行pkg search llama搜索有没有对应的软件包的时候,惊喜的发现竟然真的就有llama.cpp这一软件包。
其实在通过 Proot-Distro 启动 Debian 的时候,第一个想到的就是 llama.cpp ,可惜的是不知道是不是又是下错二进制可执行文件的原因,在运行时提示cpu backend in not loaded的错误,在两次尝试还是原因的错误后就暂时搁置了。
安装
- 安装有 Termux 的安卓手机
- 在 Termux 里面进行操作:
- 更新在线源的缓存:
pkg update
- 安装 llama-cpp:
pkg install llama-cpp
- 下载模型:
云手机的位置可能无法访问 Hugging Face 的模型仓库,为避免不必要的麻烦,还是先行下载到本地。选择
Qwen/Qwen2.5-1.5B-Instruct-GGUF:q4_k_m作为本次的测试模型。curl -LO xxx/Qwen/Qwen2.5-1.5B-Instruct-GGUF/resolve/main/qwen2.5-1.5b-instruct-q4_k_m.gguf
- 启动 llama.cpp:
llama-cli -m qwen2.5-1.5b-instruct-q4_k_m.gguf
- 更新在线源的缓存:
- 接口调用:
可以选择拉起 Web Gui 界面,在里面即可直接使用对应的API。
API接口:http://127.0.0.1:8080
体验
不知道为何就成功进入一次交互式,执行一次后还未处理完毕就卡了,重启多次后都是卡在载入模型阶段。因此这个的使用体验在手机上就没有然后了,但理论上来说也是大差不差的吧!
ChiuYut
2026年05月25日