🔄 In a Training Loop

Urro

urroxyz

89 755 100

https://urro.xyz/

urroxyz

AI & ML interests

computational linguistics major 🤖🔎🔠 i am autistic. if i come off rude, i probably didn't mean to. please feel free to ask me for clarification.

Recent Activity

updated a collection about 14 hours ago

WTF GENIUS PAPERS

upvoted a paper about 14 hours ago

CodeNib: A Multi-View Data System for Serving Repository Context to Coding Agents

updated a collection about 14 hours ago

WTF GENIUS PAPERS

View all activity

Organizations

updated a collection about 14 hours ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper about 14 hours ago

CodeNib: A Multi-View Data System for Serving Repository Context to Coding Agents

Paper • 2607.25431 • Published 3 days ago • 70

updated a collection about 14 hours ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper about 14 hours ago

Pass the Baton: Trajectory-Relayed On-Policy Distillation

Paper • 2607.26057 • Published 3 days ago • 28

updated a collection about 14 hours ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper about 14 hours ago

Towards Robust Reinforcement Learning for Small-Scale Language Model Agents

Paper • 2607.25091 • Published 4 days ago • 5

updated a collection 2 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 2 days ago

Kimi K3: Open Frontier Intelligence

Paper • 2607.24653 • Published 4 days ago • 376

updated a collection 2 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 2 days ago

Reasoning Denoiser: Denoising Reasoning Traces for Hallucination Detection in Large Reasoning Models

Paper • 2607.22098 • Published 7 days ago • 7

updated a collection 2 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 2 days ago

Codifying the Judge: Scalable Evaluation via Program Distillation

Paper • 2607.22561 • Published May 29 • 8

liked a model 4 days ago

Nanbeige/Nanbeige4.2-3B

Text Generation • 4B • Updated 2 days ago • 24.5k • 569

upvoted a paper 4 days ago

Sample-Efficient Learning from Agent Experience

Paper • 2607.21051 • Published 8 days ago • 19

updated a collection 6 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 6 days ago

Beyond Relevance-Centric Retrieval: Rubric-Oriented Document Set Selection and Ranking

Paper • 2607.19747 • Published 9 days ago • 31

updated a collection 6 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 6 days ago

Predictive Divergence Masks for LLM RL

Paper • 2607.10848 • Published 19 days ago • 11

updated a collection 6 days ago

WTF GENIUS PAPERS

Collection

Papers that made me appreciate my major and my life a little more. obs=Observation, innov=Innovation. Most papers are abt improving tiny models. • 233 items • Updated about 14 hours ago • 54

upvoted a paper 6 days ago

K12-KGraph: A Curriculum-Aligned Knowledge Graph for Benchmarking and Training Educational LLMs

Paper • 2605.09635 • Published 8 days ago • 63

Urro

AI & ML interests

Recent Activity

Organizations

urroxyz's activity