Outils

Convertisseur JSON ↔ TOON

TOON (Token Oriented Object Notation) est un format optimisé pour les LLM permettant de réduire significativement le nombre de tokens lors de la transmission de données structurées.

JSON

TOON

FAQ

Qu'est-ce que le format TOON (Token Oriented Object Notation) ?

TOON (Token Oriented Object Notation) est un format de sérialisation de données optimisé pour les LLM (Large Language Models). Il a été conçu pour réduire significativement le nombre de tokens utilisés lors de la transmission de données structurées aux modèles d'IA. Contrairement au JSON qui utilise des accolades, guillemets et virgules répétitifs, TOON utilise une syntaxe plus compacte basée sur l'indentation et les définitions de colonnes pour les tableaux.

Pourquoi utiliser TOON plutôt que JSON pour les LLM ?

L'utilisation de TOON présente plusieurs avantages majeurs pour les interactions avec les LLM : - Réduction de 40 à 70% du nombre de tokens pour les mêmes données - Coûts API réduits proportionnellement à l'économie de tokens - Contextes plus longs possibles dans la même limite de tokens - Parsing plus rapide côté LLM grâce à une structure plus linéaire - Moins d'ambiguïté dans la représentation des tableaux de données

Comment fonctionne la syntaxe TOON pour les tableaux ?

TOON utilise une syntaxe spéciale pour les tableaux qui définit les colonnes une seule fois dans l'en-tête. Format : nom_array[taille]{col1,col2,col3}: Ensuite chaque ligne représente un élément avec les valeurs séparées par des virgules. Les valeurs contenant des virgules ou des espaces sont entourées de guillemets. Cette approche évite la répétition des noms de propriétés pour chaque élément, ce qui représente le principal gain de tokens.

TOON est-il compatible avec toutes les données JSON ?

TOON supporte la grande majorité des structures JSON courantes : - Objets imbriqués (avec indentation) - Tableaux d'objets homogènes (format colonnes) - Types primitifs : chaînes, nombres, booléens, null - Valeurs de dates au format ISO Limitations actuelles : - Les tableaux d'éléments hétérogènes sont moins optimisés - Les structures très profondément imbriquées peuvent être moins lisibles - Certains caractères spéciaux nécessitent un échappement