Model Library
先按任务选模型,再比较价格和场景
模型页保留独立入口,但不再做名次墙。新手先看推荐组合,进阶用户再展开完整模型清单、类型筛选和价格来源。
模型能力和价格会持续更新
模型会按推理、编程、长文、速度、价格、上下文、国内可用性和 Agent 接入效果重新评测。价格会跟随公开信息滚动校准。
选完模型之后去哪里
模型只是大脑,不能停在对比表。选完以后要接工具、跑教程、做一个可验证 MVP。
不知道选哪个,先从这 3 个方向开始
这里不是强行推荐唯一答案,而是让不同目标的人先少走弯路:低成本、中文长文、离线私有化。
DeepSeek V4
DeepSeek V4 是模型,不是 Agent 产品。它的价值在于低成本、长上下文和兼容接口,可以作为 Claude Code、OpenCode、Cline 等 Agent/编码工具的后端模型。
Kimi K2.6
Kimi K2.6 是月之暗面当前应优先展示的开发者模型。它支持 OpenAI 兼容 API、思考开关、图片/视频输入,适合把 Claude Code、Roo Code、Cline 这类编码 Agent 接到国产模型上。
DeepSeek V4 37B
MIT开源,性价比无敌。1M上下文,单卡可跑。日常编码推荐。
快速对比
只展示前几项,避免新手第一次进来就被完整清单淹没。
展开完整模型清单和筛选
当前显示 31 个模型
GPT-5.5
OpenAI 当前高档旗舰模型,适合复杂 Agent、专业编码、跨文档分析和高质量工作流。价格按官方 API 标准 token 口径记录,展示为输入/输出每百万 token。
DeepSeek V4 37B
MIT开源,性价比无敌。1M上下文,单卡可跑。日常编码推荐。
Claude Opus 4.6
编程最强(80.8% SWE-Bench),Agent自主任务执行领先。深度推理和代码生成首选。
GLM-5.1 40B
自主编码最强开源,744B总参仅激活40B。单卡可跑。
Gemini 3.1 Pro
Google Gemini API 的高阶 Pro 模型,适合多模态理解和长上下文任务。价格会随标准、批处理、Flex、Priority 等档位变化。
Qwen 3.5 17B
397B仅激活17B。Apache 2.0,201语言。单卡流畅运行。
Claude Sonnet 4.5
平衡价格性能,日常编码Agent首选。速度比Opus快价格低60%。
Kimi K2.6 本地/开源权重
站内把本地 Kimi 入口同步到 K2.6 口径,避免继续展示旧版本词条。实际下载和量化版本以 Ollama、ModelScope、Hugging Face 等仓库同步为准。
DeepSeek V4
DeepSeek V4 是模型,不是 Agent 产品。它的价值在于低成本、长上下文和兼容接口,可以作为 Claude Code、OpenCode、Cline 等 Agent/编码工具的后端模型。
MiniMax M2.5 10B
229B仅激活10B!最低配置跑最强编码。消费级显卡可用。
GPT-5.2
数学最强(100% AIME 2025)。适合数学和逻辑密集型任务。
Gemma 4 26B
18GB内存可跑。Apache 2.0商用友好,适合消费级硬件。
o3 / o4-mini
成本效益极高的推理模型。适合预算有限的复杂推理需求。
Llama 4 Scout 17B
10M超长上下文。17B激活参数文档分析利器。
MiniMax M2.5
开源编码最强(80.2% SWE-Bench),接近Opus水平。性价比超高。
DeepSeek R1 32B
数学推理之王(97.3% MATH-500)。24GB显卡流畅运行。
Kimi K2.6
Kimi K2.6 是月之暗面当前应优先展示的开发者模型。它支持 OpenAI 兼容 API、思考开关、图片/视频输入,适合把 Claude Code、Roo Code、Cline 这类编码 Agent 接到国产模型上。
Mistral Large 3 41B
Apache 2.0,675B总参仅激活41B。欧洲数据合规首选。
GLM-5.1
国产自主编码最强(58.4% SWE-Bench Pro)。支持8小时自主编程。
Qwen Coder Next
最新开源编码专用模型。46GB内存可跑,速度极快。
Qwen 3.5 397B
多语言王者(201语言),Apache 2.0开源。多模态能力出色。
SD3 Turbo
最新SD3模型,文字渲染能力显著提升。8GB显存流畅运行。
Llama 4 Maverick
最低价API模型,1M上下文。85.5% MMLU,日常任务首选。
Whisper V3 Large
最强开源语音识别,100+语言。本地转写,准确率极高。
Mistral Large 3
欧洲最强Apache 2.0。多语言+数据合规,适合欧洲市场。
Command A
企业级RAG专用。内置引用和准确度优化,适合文档问答。
Llama 4 Scout
10M超长上下文,全球最长。单次可分析数万页文档。
GPT Realtime / Audio
实时语音模型是近期最能降低普通人使用门槛的方向之一。它适合放进语音助手、客服问答、会议纪要和个人陪练工作流。
Gemini / Veo 多模态视频能力
AI 视频和多模态是内容创作热门方向。它不是单个模型选择题,而是脚本、分镜、图像、视频、配音和发布检查的完整流程。
Qwen Coder / 通义代码模型
国产代码模型适合和 Roo Code、Cline、通义灵码、ModelScope 等工具组合,用于中文团队的代码理解和自动化开发。
Embedding + Rerank 模型组合
企业 AI 落地不只靠聊天模型,Embedding 和 Rerank 决定知识库能不能找对资料。适合放进企业知识库和 Agent 试点教程。
价格来源和选择说明
2026-05-07
公开 API 标价
7 个来源
价格会随官方策略、地区、促销、缓存、批量折扣和中转站变化。这里用于帮助新手形成选择判断,正式接入前仍应以官方控制台为准。
Next Step
模型选完以后,继续接到真实工作流
不要停在模型对比。下一步要么安装 Agent,要么回学习路线做一个小成果,再把结果放进实战复盘里。