Jiarui Yao's picture

Jiarui Yao

FlippyDora

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

Nemotron 3 Ultra: Open, Efficient Mixture-of-Experts Hybrid Mamba-Transformer Model for Agentic Reasoning

upvoted a paper 16 days ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

upvoted a paper 16 days ago

Rethinking the Divergence Regularization in LLM RL

View all activity

Organizations

Papers 9

arxiv:2601.10201

arxiv:2604.13346

arxiv:2603.13985

arxiv:2510.12693

models 65

FlippyDora/CorrectKLinRL

FlippyDora/qwen3-asr-1.7b-GGUF

2B • Updated Feb 11 • 1.73k • 2

FlippyDora/qwen3-asr-0.6b-GGUF

0.9B • Updated Feb 10 • 56 • 1

FlippyDora/anlp-hw2-outputs

Updated Oct 21, 2025

FlippyDora/all-MiniLM-L6-v2-imdb-sentiment

Text Classification • 22.7M • Updated Sep 23, 2025 • 5

FlippyDora/Qwen2_5_3B_inst_hrm_init

Text Generation • 4B • Updated Aug 5, 2025 • 3 • 1

FlippyDora/slimpajama-train-1280k

Updated May 10, 2025

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_120

2B • Updated Mar 17, 2025 • 5

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_100

2B • Updated Mar 17, 2025 • 3

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_80

2B • Updated Mar 17, 2025 • 3

datasets 117

FlippyDora/dapo-filter

Viewer • Updated Apr 21 • 9.45k • 7

FlippyDora/olympiad_bench

Viewer • Updated May 1, 2025 • 675 • 45

FlippyDora/minerva_math

Viewer • Updated May 1, 2025 • 272 • 4

FlippyDora/math500

Viewer • Updated May 1, 2025 • 500 • 63

FlippyDora/amc23

Viewer • Updated May 1, 2025 • 40 • 6

FlippyDora/aime24

Viewer • Updated May 1, 2025 • 30 • 7

FlippyDora/raft_train_numia_prompt_iter5_0_2000

Viewer • Updated Mar 11, 2025 • 6.75k • 5

FlippyDora/numia_prompt_reward_iter5_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 3

FlippyDora/raft_train_numia_prompt_iter4_0_2000

Viewer • Updated Mar 11, 2025 • 6.86k • 7

FlippyDora/numia_prompt_reward_iter4_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 4

View 117 datasets