2025 年的归档
OpenRLHF框架解读
- 07/22
- 11:16
7.20 阅读笔记
- 07/21
- 14:21
PRM 现有工作笔记
- 07/20
- 00:12
7.19 阅读笔记
- 07/19
- 13:33
SFT的一点心得
- 07/18
- 15:00
7.14 阅读笔记
- 07/14
- 14:23
7.11 阅读笔记
- 07/11
- 14:53
反思:什么样的推理数据是好的
- 07/11
- 13:10
Gemini2.x系列技术报告解读
- 07/11
- 13:10
7.10 阅读笔记
- 07/10
- 16:05