← Papiers
Lexique AGPL-3.0

L'Adressage Génératif

Le sol computationnel de XERB0XI0N — stocker des adresses, pas des contenus

Résumé

Papier proposant d'inverser le contrat du stockage : une donnée n'est pas un contenu conservé mais une adresse dans un espace génératif. Le triplet (générateur, coordonnées, résidu) devient l'unité universelle ; seul le résidu — identifié au Tsoin, la surprise de Shannon — coûte du stockage. Branches et forks deviennent des chemins partagés, gratuits par construction. Six couches techniques constructibles aujourd'hui (WASM, Merkle DAG, modèles implicites) et intégration dans tout l'écosystème.

§1Le problème — le stockage est resté féodal

Un système d’exploitation moderne gère des fichiers comme un seigneur gère des terres : chaque octet occupe une parcelle, chaque parcelle a un coût, et tout ce qui n’est pas activement conservé disparaît. Ce modèle a soixante-dix ans. Il a survécu à tous les changements de support — bande, disque, flash, cloud — sans jamais être questionné dans son principe : le contenu est la chose stockée.

Ce principe échoue au test du millénaire que Xerboxion impose à toutes ses couches [→ paper principal, §5.3]. Un contenu stocké se dégrade, se fragmente, dépend de formats propriétaires, et croît linéairement avec tout ce qu’une vie — puis une civilisation — accumule. Le coût de la mémoire totale d’une humanité multiplanétaire, dans le modèle féodal, est simplement absurde. Et il y a plus grave que le coût : le modèle féodal rend la copie chère, donc la branche chère, donc le fork cher. Or toute la gouvernance de Xerboxion repose sur le fork comme opération fondamentale [→ paper principal, §13.3]. Un système où forker coûte cher est un système où la liberté coûte cher.

Pendant ce temps, trois domaines ont démontré, chacun dans son coin, qu’un autre contrat est possible. Les jeux vidéo génèrent des univers de quintillions de planètes depuis une seed de quelques octets — le monde n’est pas stocké, il est une fonction déterministe de (seed, coordonnées). Les dépôts Git identifient chaque objet par le hash de son contenu et font partager à mille branches les objets qu’elles ont en commun — la copie devient gratuite. Et l’apprentissage machine a prouvé qu’un bon modèle prédictif est un compresseur : un réseau qui prédit bien une donnée n’a presque rien à dire pour la décrire.

Personne n’a fait de ces trois démonstrations le sol d’un système d’exploitation. C’est l’objet de ce papier.

§2La thèse — l’adresse remplace le contenu

2.1 Le renversement L’espace de toutes les données possibles existe déjà — au sens mathématique, comme la bibliothèque de Babel de Borges contient déjà tous les livres possibles. On ne crée pas une donnée : on la localise. Lire, c’est naviguer vers un point. Écrire, c’est noter le chemin vers un point qu’on vient de visiter. Le système d’exploitation cesse d’être un entrepôt et devient un navigateur : une fonction qui, donnée une adresse, rend la donnée — déterministiquement, bit pour bit, sur n’importe quelle machine, à n’importe quelle époque.

La conséquence sur la taille n’est pas une optimisation, c’est une dérivation logique : si l’OS est une fonction et non un conteneur, alors la contrainte fondatrice de XERB0XI0N — tenir dans quelques mégaoctets, tourner sur une montre [→ paper principal, §3.2] — cesse d’être une prouesse et devient une conséquence. On ne porte pas les données ; on porte la

fonction et les adresses.

2.2 Le triplet L’unité de stockage universelle proposée est le triplet :

adresse = (hash_générateur, coordonnées, hash_résidu)

Le générateur est un programme pur et déterministe, identifié par le hash de son
contenu, qui produit des données à partir de coordonnées. Il est public, open source,
partagé par tous — c’est un bien commun.

Les coordonnées localisent la donnée dans l’espace du générateur. Pour un monde
procédural, c’est (seed, x, y, z, t). Pour un réseau implicite, c’est l’entrée de la fonction.
Pour un capteur, c’est l’index spatio-temporel de la mesure [→ §7.4, courbe de Hilbert
4D].

Le résidu est l’écart, exact au bit près, entre ce que le générateur produit à ces
coordonnées et la donnée réelle. C’est la seule part qui exige du stockage véritable.

Lire : exécuter générateur(coordonnées), appliquer le résidu, obtenir la donnée exacte. Écrire : choisir un générateur, calculer sa prédiction, conserver l’écart. Vérifier : tout est hashé, tout est reproductible par n’importe qui — la confiance est une propriété de structure, pas une promesse [→ paper principal, §3.3].

2.3 Les cas dégénérés — l’ancien monde est un cas particulier du nouveau Le triplet contient les deux mondes existants comme cas limites. Générateur = fonction identité : le résidu est la donnée entière — c’est le stockage classique, intact, rétrocompatible par construction. Résidu = vide : la donnée est pure structure — c’est la génération procédurale. Entre les deux s’étend tout le spectre du réel : des données plus ou moins prévisibles, facturées exactement à hauteur de leur surprise. Aucune migration brutale n’est nécessaire ; le modèle féodal est simplement le point zéro d’un axe qu’on peut désormais parcourir.

§3Le théorème et la porte

3.1 Ce qu’aucun système ne pourra jamais faire Il faut le dire avant qu’on nous le dise. Le nombre d’adresses courtes est fini ; le nombre de données longues le dépasse. Il existe donc nécessairement des données dont la plus courte description est aussi longue qu’elles-mêmes — c’est le principe des tiroirs, et sa forme moderne est l’incompressibilité des chaînes aléatoires en complexité de Kolmogorov.

L’implémentation réelle de la bibliothèque de Babel (Basile, 2015) en est la démonstration vivante : l’adresse d’une page quelconque y est aussi longue que la page. Aucun algorithme, aucune fractale, aucun progrès matériel ne franchira ce mur. Un système qui promettrait « tout dans un kilooctet » serait faux dès la première ligne.

3.2 La reformulation qui survit Mais les données réelles ne sont jamais aléatoires. Une photo, un génome, une conversation, une ville — tout ce qui a du sens porte de la structure, et la structure a des adresses courtes dans le bon espace génératif. La thèse défendable n’est donc pas « tout est petit », mais :

Tout ce qui a du sens a une adresse courte. Ce qui n’en a pas est facturé au prix de son chaos.

Le coût de stockage d’une donnée devient une mesure de sa part d’imprévisible. Et cette mesure a un nom en théorie de l’information depuis 1948 : l’information de Shannon est précisément la surprise — ce qu’un récepteur ne pouvait pas déduire de ce qu’il savait déjà.

3.3 Le résidu comme unité de réel — la jonction avec le Tsoin C’est ici que le concept cesse d’être une technique de compression et devient une pièce de l’ontologie Xerboxion. Le paper principal définit le Tsoin comme un instant de réel — non une mesure de temps, mais une mesure d’expérience, contenant tout ce qui était présent à cet instant [→ paper principal, §9.1]. La couche de stockage en donne maintenant la face computationnelle exacte :

Le Tsoin est le résidu. Ce que le générateur savait déjà n’est pas de l’information — c’est de la structure. Ce que le générateur ne pouvait pas prédire, c’est l’instant de réel. Et c’est la seule chose que l’univers facture en stockage.

Cette identification résout proprement plusieurs points laissés ouverts. La compression progressive du Tsoin (photo, puis vidéo, puis rythme cardiaque, puis état mental…) devient mécanique : chaque dimension sensorielle ajoutée est soit prédite par le générateur — gratuite — soit du résidu — du réel véritable. La note physique du §9.1 — le Tsoin parfait est un idéal asymptotique, borné par l’incertitude de Heisenberg — trouve son écho exact en théorie de l’information : le bruit quantique est d’entropie maximale, donc incompressible, donc du résidu pur. La frontière physique du Tsoin et la frontière mathématique de la compression sont la même frontière, vue de deux disciplines. Le concept ne contourne pas ses limites ; il est défini par elles.

Et la formulation quantitative suit : un meilleur générateur produit moins de surprise, donc moins de résidu, donc moins de stockage. La qualité d’un générateur se mesure en Tsoins économisés. C’est une métrique d’ingénierie, plus une métaphore.

§4Fondements théoriques

Six piliers portent la construction. Aucun n’est spéculatif ; tous sont des résultats établis, certains depuis soixante ans.

La théorie algorithmique de l’information (Solomonoff 1964, Kolmogorov 1965, Levin 1973, Chaitin) définit la taille véritable d’une donnée comme la longueur du plus court programme qui la produit. Le prior de Solomonoff assigne à chaque programme générateur la probabilité 2^(−longueur) : la notion intuitive de « probabilité de la fractale correspondante » est formalisée depuis 1964. La recherche universelle de Levin énumère les générateurs par coût (longueur × temps) et est prouvée optimale à constante près pour les problèmes d’inversion — c’est la réponse théorique au problème central de ce papier : trouver le générateur d’une donnée n’est pas calculable exactement, mais approchable de façon optimale. Le principe MDL de Rissanen en est la version praticable.

L’équivalence prédiction-compression (Shannon 1948 ; MacKay 2003 ; Delétang et al., ICLR 2024) établit que tout prédicteur, branché sur un codeur arithmétique, devient un compresseur sans perte dont la performance égale la qualité de prédiction. La démonstration à l’échelle est récente et spectaculaire : un grand modèle de langage entraîné sur du texte compresse des images mieux que PNG et de l’audio mieux que FLAC. Le modèle est le générateur ; la donnée devient un chemin de faible surprise à travers lui.

Les systèmes de fonctions itérées (Barnsley 1988 ; Jacquin 1992) fournissent le seul théorème constructif existant pour « trouver la fractale d’une donnée » : le théorème du collage borne la distance entre l’attracteur d’un IFS et une cible en fonction de la qualité de l’ajustement, et la compression fractale qui en découle a été commercialisée dans les années 90. Le problème de la correspondance n’est pas une chimère : il a déjà été résolu, localement, pour un domaine.

Les représentations implicites (COIN, Dupont et al. 2021 ; COIN++ 2022 ; NeRF, SIREN) réalisent littéralement la donnée-comme-fonction-de-coordonnées : on surajuste un petit réseau qui mappe les coordonnées vers les valeurs, on stocke ses poids quantizés au lieu des données, on décode en évaluant la fonction — y compris partiellement, région par région, ce qui est exactement la lecture-par-navigation.

Les courbes de remplissage d’espace (Hilbert ; Haverkort ; Skilling) transforment un espace multidimensionnel en une adresse unidimensionnelle en préservant la localité. Cette couche est déjà spécifiée dans Xerboxion : c’est l’adressage Hilbert 4D du standard Cubion [→ §7.4]. Le présent papier ne l’invente pas ; il révèle que cette couche hardware était déjà l’adressage génératif, vu d’en bas.

La théorie des patches et les systèmes multiway (Darcs ; Pijul, Mimram & Di Giusto ;

Wolfram) donnent les mathématiques des branches : la fusion de deux historiques divergents comme pushout catégorique — un merge correct par construction, et non une heuristique — et le graphe de tous les chemins de computation possibles comme objet formel. Le Ruliad de Wolfram est l’espace génératif total à l’état d’objet mathématique passif ; ce papier y ajoute ce qui lui manque : un OS, une couche sociale, une gouvernance [→ carto des précurseurs].

§5Les branches — des chemins dans l’espace génératif

5.1 L’unification Dans un espace qui contient déjà tous les états possibles, une branche n’est pas une copie : c’est un chemin. La correspondance est exacte et totale :

Objet du versioning Objet dans l’espace génératif

Donnée Un point (des coordonnées)

Événement, Tsoin Un déplacement (une arête entre deux points)

Branche Un chemin

Fork Une bifurcation

Merge Une confluence

Repo Un faisceau de chemins partageant une origine

Deux branches qui divergent partagent l’intégralité de leur passé et l’intégralité de l’espace non encore visité. Elles ne coûtent que leur différence de trajectoire — quelques déplacements, quelques résidus. C’est le partage structurel de Git, des snapshots copy-on- write et des quadtrees mémoïsés de HashLife, élevé au rang de propriété universelle : forker est gratuit par construction.

5.2 La gouvernance devient une physique Le paper principal pose le fork comme opération fondamentale de la gouvernance : les désaccords se résolvent par branches qui coexistent et que le temps départage ; les forks restent visibles depuis le projet parent ; la destruction n’est jamais permanente parce que tout est event-sourcé [→ paper principal, §5.4b, §12, §13.3]. Jusqu’ici, c’étaient des principes — des règles posées par-dessus l’architecture, qu’une implémentation paresseuse aurait pu trahir.

L’adressage génératif les transforme en propriétés physiques de la couche de stockage. Le fork d’un fichier, d’une machine, d’une ville et d’une civilisation deviennent littéralement la même opération — dupliquer un pointeur de chemin — appliquée à des échelles différentes. L’axiome Xerboxion « le fork logiciel et le fork humain sont le même concept » cesse d’être une analogie féconde : c’est la même primitive. Une civilisation construite sur ce sol ne peut pas ne pas être forkable, pour la même raison qu’une rivière ne peut pas ne pas couler vers le bas. La liberté n’est plus garantie par une charte ; elle est garantie par la gravité du système.

5.3 L’argument thermodynamique de l’append-only Le principe de Landauer (1961), déjà au fondement scientifique du projet [→ paper principal, §10.2], quantifie le coût énergétique minimal de l’effacement d’un bit. Un système append- only — qui branche au lieu de supprimer, qui archive au lieu d’effacer — est donc thermodynamiquement optimal. La rétrocompatibilité éternelle et le refus de l’obsolescence [→ paper principal, §6.4] ne sont pas des préférences esthétiques : ce sont les choix d’ingénierie alignés avec la physique de l’information.

§6Architecture — les six couches

Chaque couche est constructible aujourd’hui, avec des outils existants, dans le respect des contraintes du projet : Rust d’abord, légèreté absolue, licences libres, interfaces gelées à éternité.

Couche 0 — Le substrat d’exécution déterministe. Chaque générateur est un module WebAssembly pur. Le choix est structurel : WASM est déterministe par spécification (mêmes entrées → mêmes octets sur x86, ARM, RISC-V, une montre, un microcontrôleur), sandboxé, minuscule, et son format est suffisamment simple et ouvert pour qu’un module compilé en 2026 s’exécute en 2126. C’est la règle d’or du Cubion — l’interface ne change jamais, les internals évoluent — appliquée au logiciel. Runtimes : wasmtime côté serveur, wasmi/WAMR côté embarqué.

Couche 1 — Le store adressé par contenu. Le modèle objet de Git généralisé : blob, arbre, commit, chaque objet identifié par son hash BLAKE3, organisés en Merkle DAG, avec déduplication structurelle gratuite et découpage des gros contenus par chunking défini par le contenu. Cette couche existe déjà à l’état de bibliothèques éprouvées (gitoxide, iroh) ; elle ne demande presque aucune écriture originale.

Couche 2 — L’adresse générative. Le triplet (hash_générateur, coordonnées, hash_résidu), tel que défini en §2.2. C’est la primitive nouvelle, et c’est le format à geler comme on a gelé le connecteur CFC : petit, versionné, éternel. Sa spécification v0 tient en

une page et constitue le premier livrable du composant [→ §11].

Couche 3 — Le journal et les branches. Le journal des déplacements et des résidus est lui-même un Merkle DAG ; une branche est un pointeur ; un fork est la copie d’un pointeur ; un merge suit la théorie des patches. Pour l’état machine complet, la version constructible immédiatement assemble trois technologies mûres : un filesystem copy-on-write (btrfs/ZFS) pour les données, le gel/restauration de processus (CRIU) pour l’exécution, et des générations à la NixOS pour la configuration. Un commit de machine entière, branchable, en quelques secondes : c’est la promesse du « système qui gère des états, pas des fichiers » [→ §7.2], avec son mécanisme.

Couche 4 — Les générateurs de domaine. La correspondance universelle étant non- calculable (§3.1), le système l’approche par domaine. Quatre familles de départ : les représentations implicites pour l’image et la scène ; un modèle de langage local couplé au codage arithmétique pour le texte et la connaissance ; la génération procédurale pure pour le contenu synthétique ; des prédicteurs auto-régressifs simples pour les flux de capteurs. Chaque domaine appartient à un PL0XI0N [→ §7.5].

Couche 5 — La navigation. L’espace d’adresses est ordonné par la courbe de Hilbert 4D ; zoomer, c’est descendre dans l’arbre de Merkle ; presser, c’est écrire un résidu. L’interface et le système de fichiers fusionnent : il n’y a pas une UI posée sur le stockage, il y a un espace dans lequel on se déplace, et l’écran est la coupe locale de ce déplacement.

§7Intégration dans l’écosystème XERB0XI0N complet

Cette section déploie le concept dans chaque composant du paper principal, dans l’ordre de son §3. Pour chacun : ce que l’adressage génératif change, et ce qu’il rend enfin mécanique parmi les promesses déjà posées.

7.1 XERB0XI0N — le kernel routeur devient un navigateur Le précurseur technique documenté en §3.2c du paper principal — un kernel central minimal dont le seul rôle est de router les entrées vers des OS complets et indépendants — reçoit ici sa définition exacte : le kernel route des coordonnées vers des générateurs. Il ne possède rien, ne contient rien, ne décide de rien ; il résout des adresses. Les conteneurs .xos du §3.2 deviennent des régions de l’espace génératif, chacune avec ses générateurs propres, isolées par construction puisqu’un module WASM ne voit que ses coordonnées. Et le schéma d’évolution du §3.2b — de l’OS minimal d’aujourd’hui à la machine à Tsoins dans mille ans — devient un seul axe continu : la même primitive, le triplet, portée par des générateurs de plus en plus fidèles au réel.

7.2 B0XI0N — le Tsoin machine a son mécanisme Le paper principal définit B0XI0N comme le premier système où l’ordinateur committe un instant T de lui-même en entier — un OS qui gère des états, pas des fichiers [→ §3.3]. L’adressage génératif en donne l’implémentation : un état machine = (coordonnées dans l’espace des configurations) + (résidus accumulés depuis l’origine). Committer la machine, c’est noter un point sur son chemin. Brancher la machine, c’est bifurquer. Revenir en arrière, c’est se déplacer. Faire une erreur cesse structurellement d’être un problème — non par politique de sauvegarde, mais parce que la destruction n’existe pas dans un espace où tout état visité reste adressable.

La règle 50/50 — moitié données personnelles chiffrées, moitié contribution à la redondance du réseau [→ §3.3] — gagne une asymétrie économique décisive : les générateurs sont des biens communs open source, répliqués gratuitement et infiniment par nature ; seuls les résidus — petits, chiffrés par la clé GPG de leur propriétaire — ont besoin de la redondance physique. La moitié redondante de chaque B0XI0N ne stocke donc que de la surprise chiffrée d’autrui : le strict irréductible. Le réseau protège exactement ce qui ne peut pas être régénéré, et rien d’autre.

7.3 XI0N — on ne transmet plus des données, on transmet des adresses C’est la dérivation la plus puissante du modèle, et elle était invisible avant lui. Si deux machines partagent les mêmes générateurs — et elles les partagent, puisque les générateurs sont des communs versionnés —, alors communiquer une donnée se réduit à communiquer son triplet : quelques octets de coordonnées, plus le résidu. La bande passante requise s’effondre à hauteur de la surprise transmise. XI0N, défini comme le minimum nécessaire pour que deux entités communiquent [→ §3.4], trouve ici son contenu exact : le minimum, c’est le résidu.

À l’échelle locale, c’est une optimisation. À l’échelle interplanétaire, c’est la différence entre possible et impossible. La vision du §10.2 — chaque B0XI0N de chaque planète contenant l’intégralité de la connaissance du réseau — se heurte frontalement aux lois de Shannon si l’on transmet des contenus à travers des heures-lumière. Elle devient praticable si l’on ne transmet que des résidus : la structure voyage une fois (ou se reconstruit sur place depuis les dépôts publics), puis les mondes n’échangent plus que leurs surprises mutuelles. Une colonie martienne synchronisée avec la Terre n’échange pas des bibliothèques ; elle échange ce que chacune des deux planètes a appris que l’autre ne pouvait pas prédire. La connaissance devient omnidirectionnellement redondante parce que l’essentiel de la connaissance est de la structure, déjà présente partout.

7.4 Cubion — le hardware et le logiciel sont la même adresse La couche Cubion spécifie déjà un adressage Hilbert 4D (x, y, z, t) pour ses topologies

réseau, avec la propriété de préservation de localité qui fait que des Tsoins voisins dans le réel restent voisins dans l’adresse. Le présent papier ne lui ajoute rien — il constate la convergence : le champ « coordonnées » du triplet, pour toute donnée issue d’un capteur physique, est l’index Hilbert du Cubion qui l’a captée. L’adressage logiciel et l’adressage matériel sont le même objet vu de deux côtés, ce qui est exactement la propriété d’auto-similarité que l’écosystème revendique à toutes ses échelles [→ paper principal, §3.1]. Un cluster Cubion qui grandit étend la courbe de Hilbert ; la courbe étendue agrandit l’espace d’adresses ; l’espace agrandi est immédiatement navigable par le même OS, du bion au vaisseau interstellaire, sans changement de standard.

7.5 PL0XI0NS — chaque plugin est un domaine génératif Le système de plugins [→ §3.8] reçoit une définition de plus, parfaitement alignée avec « chaque PL0XI0N est son propre OS » : un PL0XI0N est un domaine de réalité muni de ses générateurs. Le PL0XI0N agriculture apporte les prédicteurs des flux de capteurs de serre ; le PL0XI0N cartographie apporte les générateurs de terrain ; le PL0XI0N audio apporte ses modèles de signal. Installer un plugin, c’est enrichir l’espace adressable du système — littéralement agrandir le monde dans lequel l’utilisateur peut naviguer. Et la qualité d’un PL0XI0N se mesure objectivement : en Tsoins économisés sur son domaine (§3.3).

7.6 XERAX — le cerveau comme générateur (prospectif)

   [Couche prospective — parallèle scientifique réel, implémentation lointaine, à manier

avec la prudence du §3.6 du paper principal.]

Les neurosciences computationnelles contemporaines décrivent le cerveau précisément dans les termes de ce papier : le codage prédictif (Rao & Ballard 1999 ; Friston) modélise le cortex comme une machine qui prédit en permanence ses entrées sensorielles et ne propage vers le haut que les erreurs de prédiction — les résidus. Si ce cadre est correct, alors le cerveau pratique déjà l’adressage génératif : ce qu’il consolide en mémoire, ce qu’il rêve, ce qui le surprend — c’est de la surprise au sens de Shannon. Le Tsoin humain (le souvenir cristallisé du §9.1) et le Tsoin machine (le résidu du §3.3) seraient alors deux implémentations du même principe.

Pour XERAX, la conséquence de long terme est une interface de résidus partagés : non pas transférer des expériences — exclu par l’axiome de souveraineté [→ §3.6] — mais échanger des connaissances factuelles sous leur forme la plus compacte, celle que les deux cerveaux-générateurs ne pouvaient pas prédire. Rien ici n’est implémentable aujourd’hui ; mais l’architecture proposée est, au minimum, biomimétique — et c’est un argument de design, pas une preuve.

7.7 XERB0T — les flottes synchronisées par la surprise Un robot XERB0T navigue le réel avec un modèle du monde — un générateur. Ce qu’il observe de conforme à son modèle ne coûte rien ; ce qui l’en écarte est un résidu, rapporté au réseau. Une flotte entière apprend en fusionnant ses flux de résidus : chaque machine ne communique que ce que les autres n’auraient pas prédit. Et la mission du XERB0T au sens du §9.2 — agir dans le réel pour créer les conditions de Tsoins choisis — devient mesurable : une mission réussie est une trajectoire dans l’espace des états dont l’arrivée correspond aux coordonnées visées.

7.8 RepoVerse — deux façons de contribuer, une seule monnaie RepoVerse attribue de l’XP par commit, par review, par aide [→ §5.4b]. L’adressage génératif révèle que toute contribution appartient à l’une de deux familles : améliorer un générateur — réduire la surprise collective, rendre le monde plus compréhensible — ou apporter du résidu nouveau — du réel inédit, de l’expérience, de la mesure, de l’art. Les bâtisseurs compriment ; les explorateurs étendent. Les deux sont nécessaires, exactement comme le paper principal l’affirmait des organisateurs et des inventeurs, et la frontière entre les deux est désormais une grandeur d’information, pas une intuition. Les forks visibles depuis le projet parent — on voit toujours l’arbre entier — sont la conséquence directe du §5.1 : tous les chemins habitent le même espace.

7.9 Le Tsoin — la boucle est bouclée Le §9 du paper principal demandait une machine à Tsoins à l’horizon du millénaire : stocker des instants de réel, les rejouer, les offrir comme primers aux autres. Le présent papier en livre la moitié computationnelle : le Tsoin a maintenant un format (le résidu dans le triplet), une adresse (Hilbert 4D), un coût (son entropie), une économie (la règle 50/50 asymétrique), un canal (XI0N transmet des Tsoins, par définition), et une limite physique cohérente (le bruit quantique comme résidu pur, en écho exact à la note Heisenberg du §9.1). Le replay reste la moitié XERAX du problème — prospective. Mais la capture, le stockage, le partage et la navigation des Tsoins sont, à partir de ce papier, de l’ingénierie ordinaire.

7.10 Gouvernance et durée — la liberté par construction Tout est un repo [→ §13.3] ; les décisions sont des commits ; le griefing est absorbé parce que la destruction n’est qu’une branche de plus [→ §12]. Le §5.2 du présent papier établit que ces principes sont désormais portés par la couche de stockage elle-même. Il faut en tirer la conséquence de gouvernance la plus importante : un système dont la liberté dépend de règles peut être capturé par qui contrôle les règles ; un système dont la liberté est une propriété physique de sa couche la plus basse ne peut être capturé qu’en le détruisant entièrement. C’est l’anti-SPOF appliqué au pouvoir. Et c’est, en

dernière analyse, pourquoi cette couche est désignée comme le sol : si elle tient, tout ce qui est construit dessus hérite de ses propriétés.

§8État de l’art — qui a posé quelle pierre

L’honnêteté du positionnement est une condition de crédibilité, et elle se trouve être confortable : chaque composant de l’assemblage a un précédent qui le prouve. Unison (v1.0, 2025) adresse tout le code par le hash de son arbre syntaxique dans un espace d’adresses immuable — la philosophie « on découvre les définitions, on ne les crée pas » à l’état de produit. NixOS dérive un OS entier comme fonction pure d’une déclaration, avec des générations branchables et un rollback natif. Urbit fait de l’état complet d’un serveur personnel une fonction pure d’un event log déterministe — un Tsoin machine linéaire, sans branches et sans ouverture. COIN et sa descendance stockent des données comme fonctions de coordonnées et battent JPEG à bas débit. Barnsley et Jacquin ont résolu « trouver la fractale » pour l’image et l’ont commercialisé. HashLife mémoïse un univers auto- similaire et calcule 10^100 générations. Delétang et al. ont prouvé à l’échelle que la prédiction est de la compression. La génération procédurale produit des quintillions de mondes depuis des seeds. Et la bibliothèque de Babel, implémentée, démontre à la fois la navigation totale et sa limite exacte.

Aucun de ces systèmes ne possède : la décomposition structure/résidu comme primitive universelle de stockage, l’identification du résidu à une unité d’expérience, les branches multi-échelles sur espace génératif partagé, et l’intégration verticale du connecteur physique à la gouvernance. L’assemblage est la contribution — et c’est précisément le mode de contribution que le paper principal revendique pour l’ensemble du projet [→ §6.2, l’intégration verticale complète].

(Note de nommage : « Fractal » est déjà le nom de deux OS sans rapport — un OS de recherche du MIT CSAIL présenté à IEEE S&P 2026, et un hobby-OS. Le nom canonique de ce composant sera un mot Xerboxion. Voir §12.)

§9La revendication — ce qui est neuf, précisément

Trois affirmations, formulées pour être attaquées :

  1. L’adresse générative comme primitive d’OS. Le triplet (générateur, coordonnées, résidu) comme unité de stockage universelle, dont le stockage classique (générateur identité) et la génération procédurale (résidu vide) sont les deux cas dégénérés. Les pièces existent ; la primitive unifiée, non.

  2. Le résidu comme unité de réel. L’identification formelle Tsoin = surprise de Shannon = l’unique objet stocké, avec sa conséquence métrique : la qualité d’un générateur se mesure en résidu économisé. L’équivalence prédiction-compression est prouvée ; personne n’en avait fait l’ontologie d’un système et d’une expérience vécue.

§10Les branches comme chemins d’un espace génératif partagé. Fork et merge

identiques de l’octet à la civilisation, par partage structurel, faisant de la forkabilité une propriété physique et non une politique. Git, ZFS et NixOS branchent des données ou des configurations ; personne ne branche un espace génératif, et personne n’a unifié le fork technique et le fork social par la couche de stockage.

Et la dette, déclarée en clair parce que l’honnêteté est une arme : Solomonoff a formalisé la probabilité du générateur correspondant en 1964 ; Levin a donné l’algorithme de recherche optimal en 1973 ; Barnsley l’a fait fonctionner sur des images en 1988 ; Oxford l’a refait avec des réseaux en 2021 ; DeepMind a prouvé l’équivalence à l’échelle en 2024. Ce papier ne revendique aucun de ces résultats. Il revendique d’en faire, pour la première fois, le sol d’un système d’exploitation — et d’une civilisation versionnée.

§11Limites et problèmes ouverts

Le mur de la correspondance. Trouver le meilleur générateur d’une donnée arbitraire est non-calculable (§3.1, §4). Le système l’approche par domaine et ne promet jamais l’universel. Tant que cette approche reste par domaine, l’OS génératif est une direction asymptotique — comme le Tsoin parfait — et non un produit fini. C’est assumé, et c’est cohérent avec la nature de palier, jamais d’état figé, que le paper principal donne à Xerboxion lui-même [→ §3.2].

Le déterminisme des générateurs neuronaux. L’inférence en virgule flottante n’est pas identique au bit près entre architectures. Deux voies : la quantization entière des générateurs, ou une implémentation de référence WASM canonique contre laquelle tous les résidus sont calculés. La décision conditionne le gel du format d’adresse — elle est donc prioritaire.

Le coût de la régénération. Échanger du stockage contre du calcul n’est avantageux que si la génération est rapide ou le cache intelligent. Réponse architecturale : un cache mémoïsé par hash — on régénère une fois, on conserve tant qu’il y a de la place, on jette sans risque puisque tout est régénérable. La mémoire vive devient la seule « vraie » mémoire du système ; le reste est de la politique de cache. Le papier doit dire où le modèle gagne et où il perd, jamais qu’il gagne partout.

L’asymétrie de l’écriture. Lire est rapide ; bien écrire (trouver le générateur, calculer le

résidu) est lent — c’est le problème de Barnsley. Réponse : l’encodage différé. On stocke brut (générateur identité), et un processus de fond ré-encode quand les ressources sont libres — y compris rétroactivement, quand un meilleur générateur apparaît : le système ré- encode son propre passé avec moins de surprise. Un système qui apprend à mieux comprendre son histoire compresse son histoire. (La résonance avec la consolidation mnésique pendant le sommeil est notée, et laissée au Livre.)

La croissance du journal. Un monde append-only accumule. Réponses : la compaction rétroactive ci-dessus, la redondance 50/50 ciblée sur les seuls résidus (§7.2), et l’acceptation assumée — déjà argumentée par Landauer — que conserver est plus économe qu’effacer, à l’échelle où ce système pense.

La confiance dans les générateurs. Un générateur est exécutable ; un exécutable peut mentir. Réponses structurelles : pureté et sandboxing WASM, identification par hash, reproductibilité vérifiable par quiconque — la sécurité comme propriété émergente de la transparence, conformément au §3.3 du paper principal.

§12Chemin d’implémentation — l’échelle de preuve

Pas de calendrier — un ordre logique. Chaque palier est autonome, publiable, et rend le suivant légitime.

Palier 0 — La spécification. Le format du triplet, v0 : champs, encodage, versionnement, règles de gel. Une page. C’est le CFC de la couche logicielle.

Palier 1 — Le codec aller-retour. Un outil en ligne de commande : encoder une image en triplet (générateur implicite quantizé, coordonnées, résidu), la décoder bit pour bit, mesurer contre PNG et JPEG. C’est la preuve de la couche 2, exécutable sur une seule machine de travail avec un GPU grand public.

Palier 2 — Le store branchable. Les triplets dans un Merkle DAG avec branch et merge ; démonstration de deux branches d’un même corpus partageant la quasi-totalité de leurs objets.

Palier 3 — Le Tsoin machine v0. Snapshot copy-on-write + gel de processus + générations : commit, branche et restauration d’une machine personnelle entière en une commande. Indépendant des paliers 1-2 ; constructible immédiatement sur du matériel ordinaire ; c’est la promesse B0XI0N rendue tangible.

Palier 4 — Le générateur de connaissance. Un modèle de langage local comme modèle d’entropie, codage arithmétique, mesure du coût en résidu d’un corpus réel de connaissances. (Le premier corpus de test naturel : les archives du projet lui-même — le

système compresse l’histoire de sa propre conception.)

Palier 5 — La navigation. Le store branché sur une interface de zoom : se déplacer dans ses données comme dans un monde généré, lire en zoomant, écrire en pressant.

Au-delà des paliers : l’intégration B0XI0N réseau (échange de résidus chiffrés), puis XI0N inter-machines, puis la convergence avec l’adressage Hilbert du Cubion sur capteurs réels. Chaque étape réutilise le même triplet. Le standard ne change pas en grandissant — c’est sa définition.

§13Décisions ouvertes

[À trancher par le mainteneur du projet — aucune n’empêche les paliers 0-3.]

  1. Le nom canonique. « Adressage génératif » est descriptif ; « OS fractal » est pris deux fois ailleurs et trop étroit. Le nom appartient à la famille morphologique de l’écosystème. À nommer.

  2. Le déterminisme neuronal. Quantization entière ou implémentation de référence canonique (§10). À trancher avant le gel du format.

§14Le périmètre du gel v1. Quels champs du triplet sont éternels, lesquels sont

versionnés.

  1. La sémantique de merge des résidus. Théorie des patches intégrale (pushouts) ou modèle simplifié pour la v0.

  2. La place dans le paper principal. Section nouvelle du §3, ou refonte du §3.2 autour de cette primitive.

Références Fondations théoriques

Shannon, C.E. (1948). A Mathematical Theory of Communication. — L’information
comme surprise ; la borne du résidu.

Landauer, R. (1961). Irreversibility and Heat Generation in the Computing Process. — Le
coût d’effacer ; l’argument de l’append-only.

Solomonoff, R. (1964). A Formal Theory of Inductive Inference. — La probabilité
2^(−longueur) du générateur correspondant.

Kolmogorov, A. (1965). Three Approaches to the Quantitative Definition of Information. — L’incompressibilité ; le mur.

Levin, L. (1973). Universal Sequential Search Problems. — La recherche optimale du générateur.

Rissanen, J. (1978). Modeling by Shortest Data Description. — Le MDL, version praticable.

Li, M. & Vitányi, P. An Introduction to Kolmogorov Complexity and Its Applications.

MacKay, D.J.C. (2003). Information Theory, Inference, and Learning Algorithms. — Compression et modélisation, une seule chose.

Le générateur

Barnsley, M. (1988). Fractals Everywhere. — IFS, théorème du collage.

Jacquin, A. (1992). Image Coding Based on a Fractal Theory of Iterated Contractive Image Transformations. — La compression fractale opérationnelle.

Gosper, R.W. (1984). Exploiting Regularities in Large Cellular Spaces. — HashLife ; l’univers mémoïsé.

Dupont, E. et al. (2021). COIN: COmpression with Implicit Neural Representations. arXiv:2103.03123 ; et COIN++ (2022).

Mildenhall, B. et al. (2020). NeRF ; Sitzmann, V. et al. (2020). SIREN. — La donnée comme fonction de coordonnées.

Delétang, G. et al. (2024). Language Modeling Is Compression. ICLR. — L’équivalence prouvée à l’échelle.

Bellard, F. NNCP / ts_zip. — La compression neuronale praticable.

Les branches et le système

Torvalds, L. (2005–). Git. — Le Merkle DAG ; le partage structurel.

Mimram, S. & Di Giusto, C. (2013). A Categorical Theory of Patches. — Le merge comme pushout ; Pijul.

Dolstra, E. (2006). The Purely Functional Software Deployment Model. — L’OS comme fonction ; NixOS.

Unison Computing (2025). Unison 1.0. unison-lang.org — Le code adressé par contenu.

Urbit Whitepaper. — L’OS comme event log déterministe. (Précédent technique ; modèle de gouvernance opposé au nôtre.)

Wolfram, S. — Multiway Systems / Branchial Space. — Le graphe de tous les chemins.

Haverkort, H. ; Skilling, J. — Courbes de Hilbert nD. (Déjà au corpus Cubion.)

Rao, R. & Ballard, D. (1999). Predictive Coding in the Visual Cortex ; Friston, K. — (Parallèle XERAX, §7.6.)

Imaginaire fondateur

Borges, J.L. (1941). La Bibliothèque de Babel ; Basile, J. (2015). libraryofbabel.info. — L’espace total, imaginé puis implémenté — et sa limite exacte.

Persson, M. (2011). Minecraft. — La seed : un monde entier depuis un point d’entrée. (Déjà aux références du paper principal.)

L’ADRESSAGE GÉNÉRATIF © 2026 J0BOT — Licence MIT j0bot.ch · github.com/j0bot · Ne pas nuire.

Statut : draft · Licence : AGPL-3.0 · 01.06.2026 · adressage-generatif

NEURAL LOAD: 87%
THOUGHT CRIMES: 13
OVERSEER: XERBOXION
REALITY STATUS: LOADING...
j0bot.ch
Spotify
Spotify · clic pour lancer
📞 Appel
⏺ records
00:00
mes records (locaux, persistants)
aucun record
🎨 ploxion-theme ×