第 23 周 · 2026 年 6 月 · AI 工作流 · 产品 · 笔记
阴 · 16° · cnwez.com
Guide

LLM Evaluation Guide

How to build a reliable model evaluation framework

· Guide

LLM 评测指南

从评测维度、数据集构建、自动评分到人工复核的完整流程。