分类

What's the difference?

Home
categories

Scroll down

BIMU

I`m

地址:

Earth
年龄:

21

Meachine Learning

Uncertain Estimate

04/27
00:35

笔记：DPO 与 GRPO 的内在同构性分析

04/27
00:35

优化器入门：从SGD到AdamW

03/11
18:02

SPPO ：我的第一篇

11/10
22:08

RL?加权的SFT罢了

10/15
09:22

对xxPO的思考

09/01
13:56

8.13阅读笔记总结

08/13
17:18

7.20 阅读笔记

07/21
14:21

7.19 阅读笔记

07/19
13:33

SFT的一点心得

07/18
15:00

12 3