经验分享作者:小白站长2026-05-02
Review Detail
Agent 本地部署全攻略:从选硬件到跑通第一个模型
这是一条社区沉淀内容。先看它解决了什么问题、用到了哪些工具、最后留下了哪些可复用经验。
本地部署硬件Ollama配置
很多人想在自己电脑上跑 Agent,但不知道能不能跑得动。整理一份硬件对照表。
💻 配置分级(照着买/照着用):
入门级(8GB内存/核显)
可跑:Qwen3 7B、Gemma 4、Phi-4
用途:日常聊天、简单问答、文案润色
体验:能用但别期待太快,生成速度像打字
进阶级(16GB内存/6-8GB显存)
可跑:Qwen3 14B、MiniMax M2.5 10B、DeepSeek R1 8B
用途:编程辅助、文档分析、Agent日常任务
体验:流畅度明显提升,日常使用够了
高端级(32GB内存/12-24GB显存)
可跑:Qwen 3.5 17B、DeepSeek V4 37B、GLM-5.1 40B
用途:复杂编程、长文档分析、多任务并行
体验:接近云端API的速度和质量
发烧级(64GB+/多卡)
可跑:Llama 4 Scout、Qwen3 235B
用途:研究和重度使用
🔧 安装顺序:
① 装Ollama(ollama.com下载安装)
② 终端:ollama run qwen3:7b(先试最小的)
③ 装LM Studio(图形界面,方便切换模型)
④ 装OpenClaw/Hermes(真正的Agent框架)
⑤ 让Agent调用Ollama的本地模型
💰 成本对比:
本地方案:一次性投入(显卡约3000-8000元),之后零成本
云端API:DeepSeek约¥1/百万token,GPT-5约$3.75/百万token
如果每天用AI超过2小时,买张显卡本地跑更划算。
相关教程
Next Step
看完这条沉淀,下一步不要停在收藏
能复用就回学习路线做一个小成果;有结果就写复盘;缺工具就先把工具链补齐。
写一条有效评论 +3XP
补充你的用法、坑点、替代工具或可执行步骤。社区现在按内容价值沉淀,不按铭牌展示。