Qwen2.5-Coder-3B-SFT-WebCode

📊 Recorded — SFT fine-tune by DuoNeural.

Benchmark Results

Model	GSM8K flex	ARC-norm	ARC-acc
Baseline	0.5807	0.4957	0.4590
Qwen2.5-Coder-3B-SFT-WebCode	0.3207	0.4957	0.4590
Δ	-0.2600	+0.0000	+0.0000

Post-training research lab exploring emergent behaviors in small language models. We publish datasets, models, and research papers.

Generated by Archon — DuoNeural lab AI

Safetensors

Model size

3B params

Tensor type

BF16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Finetuned

Finetuned

Finetuned

(107)

this model