Meachine Learning
Uncertain Estimate
- 04/27
- 00:35
笔记:DPO 与 GRPO 的内在同构性分析
- 04/27
- 00:35
优化器入门:从SGD到AdamW
- 03/11
- 18:02
SPPO :我的第一篇
- 11/10
- 22:08
RL?加权的SFT罢了
- 10/15
- 09:22
对xxPO的思考
- 09/01
- 13:56
8.13阅读笔记总结
- 08/13
- 17:18
7.20 阅读笔记
- 07/21
- 14:21
7.19 阅读笔记
- 07/19
- 13:33
SFT的一点心得
- 07/18
- 15:00