Qwen3 4B Thinking 2507 - MiMo V2 Flash Distill

This model was trained on a reasoning dataset of MiMo V2 Flash.

This qwen3 model was trained 2x faster with Unsloth and Huggingface's TRL library.

An Ollama Modelfile is included for easy deployment.

GGUF

Model size

4B params

Architecture

qwen3

Hardware compatibility

2-bit

3-bit

4-bit

5-bit

6-bit

8-bit

16-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for TeichAI/Qwen3-4B-Thinking-2507-MiMo-V2-Flash-Distill-GGUF

Base model

Finetuned

Finetuned

Quantized

(1)

this model