EM-RAFT

community

AI & ML interests

None defined yet.

models 260

ScaleML-RLHF/Llama-1B-em-raftpp-iter4

1B • Updated Jul 29, 2025 • 2

ScaleML-RLHF/Llama-1B-em-raftpp-iter10

1B • Updated Jul 29, 2025 • 1

ScaleML-RLHF/Llama-3B-em-raftpp-iter6

4B • Updated Jul 29, 2025

ScaleML-RLHF/Llama-3B-em-raftpp-iter5

4B • Updated Jul 29, 2025

ScaleML-RLHF/Llama-3B-em-grpo-iter8

4B • Updated Jul 29, 2025 • 1

ScaleML-RLHF/Llama-3B-em-raftpp-iter4

4B • Updated Jul 29, 2025

ScaleML-RLHF/Llama-3B-em-grpo-iter7

4B • Updated Jul 29, 2025

ScaleML-RLHF/Llama-3B-em-raftpp-iter3

4B • Updated Jul 29, 2025

ScaleML-RLHF/Llama-3B-em-raftpp-iter2

4B • Updated Jul 29, 2025 • 1

ScaleML-RLHF/Llama-3B-grpo-step120

4B • Updated Jul 29, 2025

View 260 models

datasets 17

ScaleML-RLHF/numina_math

Viewer • Updated Mar 21, 2025 • 455k • 8

ScaleML-RLHF/numina_math_15

Viewer • Updated Mar 20, 2025 • 10k • 10

ScaleML-RLHF/numina_math_14

Viewer • Updated Mar 20, 2025 • 10k • 10

ScaleML-RLHF/numina_math_13

Viewer • Updated Mar 20, 2025 • 9.99k • 9

ScaleML-RLHF/numina_math_12

Viewer • Updated Mar 20, 2025 • 10k • 11

ScaleML-RLHF/numina_math_11

Updated Mar 20, 2025 • 8

ScaleML-RLHF/numina_math_10

Viewer • Updated Mar 20, 2025 • 9.98k • 10

ScaleML-RLHF/numina_math_9

Viewer • Updated Mar 20, 2025 • 9.99k • 9

ScaleML-RLHF/numina_math_8

Viewer • Updated Mar 20, 2025 • 9.99k • 8

ScaleML-RLHF/numina_math_7

Viewer • Updated Mar 20, 2025 • 10k • 9

View 17 datasets