第 23 周
·
2026 年 6 月
·
AI 工作流 · 产品 · 笔记
阴 · 16°
·
cnwez.com
YW
闫伟伟
/ cnwez.com
文章
作品
文档
能力
联系
搜索
⌘K
EN
Guide
LLM Evaluation Guide
How to build a reliable model evaluation framework
2026-03-30
·
Guide
LLM 评测指南
从评测维度、数据集构建、自动评分到人工复核的完整流程。