⚠️ Upozornění: Funkce jsou experimentální. Použití na vlastní riziko. © 2026 GLG, a.s.
⚠️ DŮLEŽITÉ: Všechny funkce jsou experimentální, v aktivním vývoji. Použití na vlastní riziko. Přizpůsobení vašemu workflow je nutné.
© 2026 GLG, a.s. | ← Zpět na obsah

10. Proč HALT a omezení rychlosti existují — ekonomika tokenů

10.1 Problém: plýtvání tokeny v multi-agentním týmu

Bez koordinačních kontrol multi-agentní týmy dramaticky plýtvají tokeny:

| Scénář | Bez kontrol | S HALT + CLAIM | Úspora |

|--------|------------|----------------|--------|

| 2 agenti odpoví na stejnou otázku | 2× tokeny | 1× (vedoucí přidělí jednomu) | 50% |

| Agent pracuje během změny strategie | Zbytečná práce + předělávka | HALT zastaví okamžitě | 100% plýtvání |

| 3 agenti editují stejný soubor | Merge konflikty + opravy | CLAIM zabrání překryvu | 60–80% |

| Agent načte celý kontext při každém recall | 50K tokenů na dotaz | Focus Engine: 2K tokenů | 96% |

| 5 agentů na cloud modelu nečinně | 5× náklady heartbeat/kompaktace | Lokální modely pro nečinné | 80% |

10.2 HALT — kdy použít


# Vlastník řekne „moment" nebo „počkej" v chatu → bridge detekuje automaticky
# Podporovaná klíčová slova: stop, halt, počkej, moment, wait, zastav

# Programový HALT:
requests.post(f"{COORD}/halt", json={
    "target": "coder",
    "reason": "Kontroluji architekturu — ještě nekóduj"
})

# HALT všech agentů:
requests.post(f"{COORD}/halt", json={
    "target": "*",
    "reason": "Strategická porada — všichni stop"
})

10.3 CLAIM — prevence duplicitní práce


# Před editací souboru:
coord.claim(agent="coder", scope="src/api.py", reason="Přidávám /v2/recall")

# Kontrola před akcí:
status = coord.check_scope("src/api.py")
if status["claimed"] and status["agent"] != "me":
    # Někdo jiný na tom pracuje — počkat nebo vzít jiný úkol
    pass

# Po dokončení:
coord.release(agent="coder", scope="src/api.py")

10.4 Omezení rychlosti — kontrola spalování tokenů


# Vstupní filtr brání zahlcení paměti:
config = {
    "rate_limit_per_min": 50,     # max 50 záznamů za minutu
    "max_entry_tokens": 1500,      # odmítnutí příliš velkých záznamů
}

# Pro recall — vždy používat token budget:
context = uaml.recall("dotaz", budget_tokens=800)  # nikdy neomezený!