超越自我吧

凭吾今之绩，复不勉？以何迎汝为吾之妻。

首页
文章
小伙伴们
隐私政策

搜索：

近期文章

[未解决]Ollama 使用 Vulkan 加速推理 2026年6月15日
解决 LLaMA.cpp 使用 MCP 代理时出现“SSL server verification failed”错误的办法 2026年6月8日
使用 PM2 对 Node.JS 程序进行进程管理 2026年6月6日
解决 LLaMA.cpp 出现 “CPU backend is not loaded” 的错误的办法 2026年5月27日
通过 Vulkan® 加快 LLaMA.cpp 的推理速度 2026年5月26日

在 Android 上安装 Termux 并通过 Debian 13（Trixie）使用 LLaMA.cpp

在前篇文章时发现，不知道怎么滴这次的 llama.cpp 竟然能跑起来了！

不知道是重启过的原因还是安装过 Ollama 的原因，在一次“意外的”尝试的时候发现竟然能成功的启动了。

竟然如此就再水一篇文章吧，前面的操作都大差不差的，就直接到下载安装这不吧。

安装

下载：

curl -LO https://github.com/ggml-org/llama.cpp/releases/download/b9294/llama-b9294-bin-ubuntu-arm64.tar.gz

解压：

tar -zxvf llama-b9294-bin-ubuntu-arm64.tar.gz

下载模型：
下载Qwen/Qwen2.5-1.5B-Instruct-GGUF:q4_k_m作为本次的测试模型。

启动：

./llama-b9294/llama-cli -m qwen2.5-1.5b-instruct-q4_k_m.gguf

将会启动命令行的交互界面使用模型。

体验

成功的使用并体验……速度都是中规中矩的慢。

ChiuYut

2026年05月25日

发布者

ChiuYut

咦？我是谁？这是什么地方？ Ya ha！我是ChiuYut！这里是我的小破站！查看ChiuYut的所有文章

发布于 2026年5月25日2026年5月27日作者 ChiuYut分类 Centos、Debian、LLaMA、Ubuntu、容器化、日志

文章导航

上一篇上篇文章：直接在 Termux 里安装 LLaMA.cpp 以使用本地运行的大语言模型环境

下一篇下篇文章：通过 Vulkan® 加快 LLaMA.cpp 的推理速度

粤ICP备18018281号-2 隐私政策

© 2015 - 2026 超越自我吧