Qwen3-72B 测评专题上线

六六门社区
开源模型 部署根据地

开源模型测评 · 本地部署经验 · 真实使用痛点——和全球开发者一起,构建本地开源部署时代,打破 API 资本霸权。

本周 287 新帖 · 回复活跃度 94%
Live Newsfeed · AI 圈要闻 & 社区动态 查看全部 →
发布 Qwen3-72B 正式开源,权重已上 HuggingFace 2h
融资 Mistral AI 完成 6 亿美元 C 轮融资 5h
开源 Meta 发布 Llama Stack 完整工具链 8h
硬件 NVIDIA RTX 5090 发布,48GB 显存跑 70B 不是梦 12h
工具 ollama 0.6 发布,新增 vision 模型一键部署 1d
论文 MoE 路由新解:Expert Choice 的中文场景验证 1d
社区 @炼丹小白 发布《我的第一次 SFT:从 0 到 1》 2m
讨论 本地模型什么时候才能真正替代云端 API?42 人参与
发布 Qwen3-72B 正式开源,权重已上 HuggingFace 2h
融资 Mistral AI 完成 6 亿美元 C 轮融资 5h
开源 Meta 发布 Llama Stack 完整工具链 8h
硬件 NVIDIA RTX 5090 发布,48GB 显存跑 70B 不是梦 12h
工具 ollama 0.6 发布,新增 vision 模型一键部署 1d
论文 MoE 路由新解:Expert Choice 的中文场景验证 1d
社区 @炼丹小白 发布《我的第一次 SFT:从 0 到 1》 2m
讨论 本地模型什么时候才能真正替代云端 API?42 人参与
01 / Featured

本周精选

02 / Trending

热门讨论

今日 本周 本月 全部
1
Qwen 🔥 烫手

Qwen3-72B 实测:中文写作能力已经超过 Claude 3.5 Sonnet?

附完整 benchmark 数据与对比图,5 项任务逐一拆解……

1,204
2
Llama

Llama-4 Maverick 本地部署踩坑指南:内存泄露是怎么回事

三种复现方式,两种临时 workaround,等官方 patch……

892
3
DeepSeek

DeepSeek-V3 的 MoE 路由为什么这么稳?拆解论文细节

从 Load Balancing Loss 到 Expert Capacity,逐一讲清楚……

745
4
Mistral✨ 新

Mistral Small 3 在 M2 Max 上的推理速度实测

tok/s 数据汇总,与 llama.cpp Metal 后端对比……

612
5
Gemma

Gemma 3 的 tokenizer 对中文真的友好了吗?

分词效率统计,中文 token 利用率与 Qwen 的对比……

534
6
Yi

Yi-1.5 34B 冷门但好用:中文长文总结的宝藏模型

10 篇文章总结对比,胜率出乎意料……

498
03 / Boards

社区板块

537
模型发布
Model Releases
  • 最新模型128
  • 热门模型342
  • 个人发布67
3,317
模型讨论
Discussions
  • 模型评测521
  • 使用技巧890
  • BUG 复现234
  • 灌水区1,672
510
概念 & 需求
Concepts & Needs
  • 新概念198
  • 产品需求312
Join the community

最好的讨论,
发生在 真正用过 的人之间。

你的每一次 A100 踩坑、每一份 benchmark 数据、每一个模型对比,都是社区最珍贵的资产。现在加入,拿下你的第一个徽章。

@本地炼丹师
2m ago
Qwen3 跑分果然强,尤其中文场景……
▲ 42 · 💬 18
@量化爱好者
5m ago
Q4 量化后显存直接降了 40%……
▲ 28 · 💬 9
@隐私优先
just now
本地部署这一年,再也没用过云 API……
▲ 15 · 💬 6