PEFT
GGUF
unsloth
agents
reasoning
teich
conversational

🚀 Gemma-4-Agentic-9b (GGUF)

Ce modèle a été fine-tuné spécifiquement pour des tâches de raisonnement agentique complexe et d'utilisation d'outils, en se basant sur Gemma-4-E2B-it-uncensored.

🛠️ Entraînement

L'entraînement a été réalisé avec Unsloth pour optimiser la VRAM, en appliquant un masquage intelligent avec Teich.

  • Objectif : Forcer le modèle à se concentrer sur l'apprentissage des schémas de pensée (thinking traces), de la logique d'appel d'outils, et des réponses finales, tout en masquant les prompts utilisateurs initiaux.
  • Contexte : 16 384 tokens
  • Méthode : LoRA (r=32, alpha=64)

📊 Datasets utilisés

Les données proviennent de traces d'agents (multi-turn) ultra-complexes issues des modèles suivants :

  1. Hermes Agent Reasoning Traces (Kimi & GLM-5.1)
  2. Qwen 3.7 Max Pi Traces

💻 Utilisation locale avec Ollama

  1. Créez un fichier nommé Modelfile contenant ceci :
FROM hf.co/Treestan325/Gemma-4-Agentic-E2B-GGUF
  1. Lancez le modèle dans votre terminal : ollama run gemma-agentic -f Modelfile
Downloads last month
498
GGUF
Model size
5B params
Architecture
gemma4
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Treestan325/Gemma-4-Agentic-E2B-GGUF

Adapter
(2)
this model

Datasets used to train Treestan325/Gemma-4-Agentic-E2B-GGUF