Engine d'Adressage Génératif — le cœur computationnel de la machine à tsoins
Résumé
Auteur : session cloudion (lane tsoin). Statut : brouillon « ? » pour review José. Code :
~/tsoin(local labo). Au fur et à mesure — màj à chaque palier. Source conceptuelle : synthèse ploxion5/bi0ns/ploxi0ns/tsoin/README.md+ paper Adressage Génératif v0.1.
Ce qui est construit et **vérifié** (vérif adversariale + mutation, round-trip bit-exact)
| Palier | Livré | Preuve |
|---|---|---|
| P0 — spec du triplet | docs/SPEC-v0.md (le « CFC logiciel », gelable) |
— |
| P1 — codec d'adressage génératif | XOR résidu, store BLAKE3 content-addressed, 4 générateurs purs | 189 aller-retours bit-exact, 0 mismatch ; résidu load-bearing ; fork gratuit |
| P2 — enregistreur de tsoins temporels | timeline branchable (Merkle DAG), delta entre moments, détecteur « xerboxion » | replay bit-exact sur 200 timelines multi-branches ; fork gratuit ; xerboxion sans faux positif |
| P4 — générateur de domaine texte | range coder maison (PAQ-style : ctx-mixing ordre 0-6 + mixer logistique + SSE) | 26 095 cas pathologiques round-trip, 0 mismatch ; 64 tests verts ; bat zstd-19 sur code+texte réels |
CLI — tsoin UTILISABLE ✅ |
record/replay/fork/stats persistants sur disque (fichiers ET dossiers) = git des états, installé sur PATH | replay bit-exact à travers process séparés ; 9 tests CLI + démo ; collapse ~7× sur de vrais braindumps ; xerboxion sans faux positif |
La machine à tsoin est LANÇABLE (José pingé 2026-06-18). C'est la « chambre de bions » réelle :
tsoin init / record <fichier|dossier> / log / replay <id> --out / fork / stats / xerboxions. On enregistre l'évolution d'un truc réel, on revient à n'importe quel instant au bit près, on branche. Commit3f479e4(sur master).
Mesures P4 — le générateur bat zstd-19 sur des données RÉELLES (et reste honnête)
fichier réel brut résidu(modèle) vs zstd-19 ratio
src/lib.rs 2935 1340 < 1395 45.7%
src/model.rs 23799 7547 < 7941 31.7%
src/timeline.rs 23916 6943 < 7089 29.0%
Cargo.lock 11790 3063 ~ 3080 26.0%
braindump.md 13404 5475 < 6048 40.9% ← un braindump de José
random 8192 8192 = (≈100%) ← PAS de free lunch
Ce qui est construit et **vérifié** (vérif adversariale + mutation)
| Palier | Livré | Preuve |
|---|---|---|
| P0 — spec du triplet | docs/SPEC-v0.md (le « CFC logiciel », gelable) |
— |
| P1 — codec d'adressage génératif | XOR résidu, store BLAKE3 content-addressed, 4 générateurs (identité/constant/linéaire/gradient2d), encode_best |
28 tests verts ; 189 aller-retours bit-exact, 0 mismatch ; résidu load-bearing (corruption détectable) ; fork gratuit |
| P2 — enregistreur de tsoins temporels | timeline branchable (Merkle DAG), on ne stocke que le delta entre moments, détecteur « xerboxion » (états identiques) | replay bit-exact sur 200 timelines multi-branches ; fork gratuit (indép. longueur) ; xerboxion sans faux positif (testé flips 1-bit) |
| P4-lite — générateur de domaine texte | (en cours) modèle de contexte + codeur arithmétique → prouver l'effondrement du résidu sur du texte/code réel | (workflow en cours, vérif au bit) |
Mesures honnêtes (P1)
corpus raw générateur résidu resid/raw
random 8192 constant 8192 100.11% ← incompressible (PAS de free lunch)
gradient_img 4096 gradient2d 17 0.42% ← matche un générateur → résidu ≈ 0
smooth_ramp 8192 linéaire 17 0.21%
Mesures (P2, « git des états »)
Session lente : store 254 o vs 3200 naïf (7.9 %) après compression jointe. Session rapide : ~100 % (honnête, pas de magie).
L'enseignement clé (ta thèse confirmée sur du RÉEL)
Sur des données qui matchent un générateur, le résidu s'effondre. Sur de l'aléatoire, non — et c'est normal. Le générateur texte (un modèle de contexte = de la connaissance apprise) fait s'effondrer le résidu du vrai code et des vrais braindumps à ~30 %, en battant zstd-19. Autrement dit, mesuré et prouvé : le générateur EST la connaissance.
L'enseignement clé (ta thèse confirmée)
Sur des données qui matchent un générateur, le résidu s'effondre. Sur de l'aléatoire, non — et c'est normal : pour gagner sur du réel (texte, code, sessions), il faut un générateur de domaine. Autrement dit : le générateur EST la connaissance. C'est pour ça que P4 (générateur texte, puis LLM) est le maillon qui rend la machine à tsoins puissante sur tes vraies données.
Mapping XERB0XI0N
- B0XION stocke les tsoins (« le git des états » ; seuls les résidus ont besoin de redondance).
- XION transmet = juste le résidu → la bande passante s'effondre à hauteur de la surprise (clé interplanétaire).
- xerboxion-core = route des coordonnées vers des générateurs (ne possède rien, résout des adresses).
Mapping XERB0XI0N (du §9.2 + papers)
- B0XION stocke les tsoins (« le git des états » ; seuls les résidus ont besoin de redondance, les générateurs se répliquent gratis).
- CUBION capture (ses coords = index Hilbert 4D — futur).
- XION transmet = juste le résidu → la bande passante s'effondre à hauteur de la surprise (clé interplanétaire).
- xerboxion-core = route des coordonnées vers des générateurs (ne possède rien, résout des adresses).
Suite
CLI tsoin utilisable (en cours) → P3 (Tsoin machine v0 = snapshot/restore d'une machine entière) → générateur LLM (corpus = les archives du projet) → navigation par zoom (Hilbert 4D).
Décisions ouvertes (José)
Nom canonique du composant · déterminisme neuronal (quantization vs WASM de réf) · périmètre du gel v1 du triplet · place dans le paper principal (§3.2).
Statut : draft · Licence : AGPL-3.0
· 18.06.2026 · tsoin-engine