10. Proč HALT a omezení rychlosti existují — ekonomika tokenů

⚠️ DŮLEŽITÉ: Všechny funkce jsou experimentální, v aktivním vývoji. Použití na vlastní riziko. Přizpůsobení vašemu workflow je nutné.

© 2026 GLG, a.s. | ← Zpět na obsah

10. Proč HALT a omezení rychlosti existují — ekonomika tokenů

10.1 Problém: plýtvání tokeny v multi-agentním týmu

Bez koordinačních kontrol multi-agentní týmy dramaticky plýtvají tokeny:

|--------|------------|----------------|--------|

10.2 HALT — kdy použít


# Vlastník řekne „moment" nebo „počkej" v chatu → bridge detekuje automaticky
# Podporovaná klíčová slova: stop, halt, počkej, moment, wait, zastav

# Programový HALT:
requests.post(f"{COORD}/halt", json={
    "target": "coder",
    "reason": "Kontroluji architekturu — ještě nekóduj"
})

# HALT všech agentů:
requests.post(f"{COORD}/halt", json={
    "target": "*",
    "reason": "Strategická porada — všichni stop"
})

10.3 CLAIM — prevence duplicitní práce


# Před editací souboru:
coord.claim(agent="coder", scope="src/api.py", reason="Přidávám /v2/recall")

# Kontrola před akcí:
status = coord.check_scope("src/api.py")
if status["claimed"] and status["agent"] != "me":
    # Někdo jiný na tom pracuje — počkat nebo vzít jiný úkol
    pass

# Po dokončení:
coord.release(agent="coder", scope="src/api.py")

10.4 Omezení rychlosti — kontrola spalování tokenů


# Vstupní filtr brání zahlcení paměti:
config = {
    "rate_limit_per_min": 50,     # max 50 záznamů za minutu
    "max_entry_tokens": 1500,      # odmítnutí příliš velkých záznamů
}

# Pro recall — vždy používat token budget:
context = uaml.recall("dotaz", budget_tokens=800)  # nikdy neomezený!