直接在 Termux 里安装 LLaMA.cpp 以使用本地运行的大语言模型环境

在安装 Ollama 后突发奇想,既然在线源有 Ollama 可选,会不会也能通过在线源安装 LLaMA.cpp 呢?

如此想着就在执行pkg search llama搜索有没有对应的软件包的时候,惊喜的发现竟然真的就有llama.cpp这一软件包。

其实在通过 Proot-Distro 启动 Debian 的时候,第一个想到的就是 llama.cpp ,可惜的是不知道是不是又是下错二进制可执行文件的原因,在运行时提示cpu backend in not loaded的错误,在两次尝试还是原因的错误后就暂时搁置了。

安装

  1. 安装有 Termux 的安卓手机
  2. 在 Termux 里面进行操作:
    • 更新在线源的缓存:
      pkg update
      
    • 安装 llama-cpp:
      pkg install llama-cpp
      
    • 下载模型:
      云手机的位置可能无法访问 Hugging Face 的模型仓库,为避免不必要的麻烦,还是先行下载到本地。

      选择Qwen/Qwen2.5-1.5B-Instruct-GGUF:q4_k_m作为本次的测试模型。

      curl -LO xxx/Qwen/Qwen2.5-1.5B-Instruct-GGUF/resolve/main/qwen2.5-1.5b-instruct-q4_k_m.gguf
      
    • 启动 llama.cpp:
      llama-cli -m qwen2.5-1.5b-instruct-q4_k_m.gguf
      
  3. 接口调用:
    可以选择拉起 Web Gui 界面,在里面即可直接使用对应的API。
    API接口:http://127.0.0.1:8080

体验

不知道为何就成功进入一次交互式,执行一次后还未处理完毕就卡了,重启多次后都是卡在载入模型阶段。因此这个的使用体验在手机上就没有然后了,但理论上来说也是大差不差的吧!

ChiuYut

2026年05月25日

发布者

ChiuYut

咦?我是谁?这是什么地方? Ya ha!我是ChiuYut!这里是我的小破站!