Aller au contenu principal

Glossaire alimentaire pour l'Analyse du Cycle de Vie

Un système de glossaire unifié pour l'Analyse du Cycle de Vie dans le domaine alimentaire, intégrant plusieurs normes avec des capacités avancées de correspondance sémantique. Conçu sur une architecture LinkML pour la compatibilité avec le web sémantique et la génération de données multi-formats.

Vous recherchez la terminologie de la plateforme ?

Ce glossaire couvre les normes de classification alimentaire et les bases de données d'Analyse du Cycle de Vie utilisées dans la recherche scientifique.

Pour la terminologie de la plateforme EOS (concepts système, termes de l'interface de programmation applicative, méthodes de calcul), consultez le Glossaire EOS.

Vue d'ensemble

Le Glossaire alimentaire pour l'Analyse du Cycle de Vie comble l'écart entre les différents systèmes de classification alimentaire et les bases de données d'Analyse du Cycle de Vie grâce à une correspondance sémantique assistée par intelligence artificielle, facilitant ainsi les évaluations environnementales précises des produits alimentaires et des chaînes d'approvisionnement pour les chercheurs, praticiens et organisations.

Statistiques clés

  • Total des termes : 168 626
  • Sources de données : 10 sources intégrées
  • Formats de sortie : 8+ formats (JSON, SQLite, RDF, TypeScript, etc.)
  • Taille de la base de données : 133 Mo (SQLite)
  • Version actuelle : 0.1.2

Fonctionnalités principales

Intégration multi-sources

Combine les données de 10 normes alimentaires et d'Analyse du Cycle de Vie de référence incluant FoodEx2, Hestia, ecoinvent, AGROvoc, et plus encore. Consultez la documentation complète des Sources de données pour les comptages de termes et les détails de couverture.

Correspondance sémantique avancée

  • Correspondance assistée par intelligence artificielle - Intégration OpenAI et Google AI pour une mise en correspondance intelligente des termes
  • Cascade en 4 étapes - Correspondance contextuelle, exacte, par synonymes et basée sur les représentations vectorielles
  • Validation de la qualité - Score de confiance et analyse de la qualité des correspondances
  • Débogage interactif - Visualisation et outils de débogage des correspondances en temps réel

Export multi-formats

Génération de données dans plusieurs formats pour différents cas d'utilisation :

  • Base de données SQLite - Optimisée pour les requêtes et les relations (133 Mo)
  • JSON/JSON-LD - Applications web et intégration au web sémantique (189 Mo)
  • LinkML YAML - Format natif avec annotations sémantiques complètes (157 Mo)
  • Types TypeScript - Intégration typée pour JavaScript/TypeScript
  • RDF/OWL - Ontologies du web sémantique
  • SQL DDL - Définitions de schémas de base de données
  • CSV/Excel - Analyse de données et applications tableur

Architecture LinkML en priorité

Construit sur LinkML (Linked Data Modeling Language) comme définition de schéma principale :

Données brutes → Analyseur → LinkML YAML → Validation → Génération multi-formats
├── JSON/JSON-LD
├── Types TypeScript
├── Ontologies RDF/OWL
├── Schémas SQL DDL
└── Base de données SQLite

Avantages :

  • Natif du web sémantique avec support intégré RDF, JSON-LD et SKOS
  • Principes de données FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable)
  • Validation améliorée avec correspondance de motifs et règles conditionnelles
  • Source unique de vérité pour tous les formats de sortie

Cas d'utilisation

Évaluation des incidences environnementales

Réalisation d'études d'Analyse du Cycle de Vie complètes avec une terminologie normalisée couvrant plusieurs systèmes de classification alimentaire.

Analyse de la chaîne d'approvisionnement

Cartographie des ingrédients et processus de différentes normes pour analyser la durabilité sur l'ensemble de la chaîne d'approvisionnement.

Classification des produits alimentaires

Normalisation des descriptions de produits utilisant une terminologie unifiée provenant de multiples sources faisant autorité.

Recherche et études académiques

Accès à un vocabulaire alimentaire et d'Analyse du Cycle de Vie complet avec des relations sémantiques pour la recherche académique.

Intégration logicielle

Intégration avec les outils d'Analyse du Cycle de Vie existants utilisant plusieurs formats d'export et interfaces typées.

Applications du web sémantique

Construction d'applications de données liées utilisant les vocabulaires JSON-LD, RDF et SKOS.

Démarrage rapide

Télécharger les données pré-construites

Le glossaire est disponible dans plusieurs formats :

# Base de données SQLite (recommandée pour les requêtes)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.db

# Format JSON (applications web)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.json

# LinkML YAML (format natif)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.yaml

# Types TypeScript
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.types.ts

Intégration TypeScript/JavaScript

import { Term, Glossary } from './glossary.types'

// Charger les données du glossaire
const glossary: Glossary = await fetch('/glossary.json')
.then(r => r.json())

// Rechercher des termes
const hestiaTerms = glossary.terms.filter(t => t.source === 'hestia')
console.log(`Found ${hestiaTerms.length} Hestia terms`)

Intégration Python

from linkml_runtime.loaders import yaml_loader
from glossary_model import Glossary, Term

# Charger le glossaire
glossary = yaml_loader.load('glossary.yaml', target_class=Glossary)

# Interroger les termes
sources = set(t.source for t in glossary.terms)
print(f"Loaded {len(glossary.terms)} terms from {len(sources)} sources")

Requêtes SQL

-- Requêtes sur la base de données SQLite
SELECT * FROM terms
WHERE source = 'hestia'
AND category LIKE '%emission%'
LIMIT 10;

-- Obtenir le nombre de termes par source
SELECT source, COUNT(*) as term_count
FROM terms
GROUP BY source
ORDER BY term_count DESC;

Requêtes RDF/SPARQL

PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dc: <http://purl.org/dc/terms/>

SELECT ?term ?label ?source WHERE {
?term skos:prefLabel ?label ;
dc:source ?source .
FILTER(CONTAINS(LCASE(?label), "emission"))
}
LIMIT 10

Documentation

Documentation de référence

Documentation technique

Architecture

Structure du projet

esfc-glossary/
├── sources/ # Données sources des fournisseurs
│ ├── foodex2/ # Fichiers Excel FoodEx2
│ ├── hestia/ # Intégration en direct via interface de programmation applicative
│ ├── ecoinvent/ # Données CSV/JSON
│ ├── agrovoc/ # Thésaurus FAO
│ └── ...
├── schema/ # Définitions de schéma LinkML
│ └── glossary.linkml.yaml
├── scripts/ # Pipeline de traitement des données
│ ├── *-parser-yaml.js
│ └── build-glossary-linkml.js
├── output/ # Fichiers de sortie générés
│ ├── glossary.db # Base de données SQLite
│ ├── glossary.json # Format JSON
│ └── glossary.yaml # LinkML YAML
└── website/ # Application React 19 + Vite
└── public/ # Ressources statiques

Pipeline de données

  1. Récupération - Téléchargement/récupération des données depuis les interfaces de programmation applicatives en direct et les sources statiques
  2. Analyse - Conversion au format LinkML YAML avec annotations sémantiques
  3. Validation - Validation selon le schéma LinkML
  4. Construction - Fusion de toutes les sources en un glossaire unifié
  5. Génération - Export vers plusieurs formats (JSON, SQLite, TypeScript, RDF)
  6. Déploiement - Publication sur l'application web et les points de téléchargement

Contribution

Le Glossaire alimentaire pour l'Analyse du Cycle de Vie est un projet ouvert. Les contributions sont les bienvenues :

  • Signaler des problèmes - Soumettre des rapports de bogues et des demandes de fonctionnalités
  • Ajouter des sources de données - Intégrer de nouveaux vocabulaires alimentaires ou d'Analyse du Cycle de Vie
  • Améliorer les correspondances - Enrichir les relations sémantiques entre les termes
  • Mettre à jour la documentation - Aider à améliorer cette documentation

Historique des versions

Version 0.1.2 (actuelle)

  • Total des termes : 168 626
  • Build : 6
  • Dernière mise à jour : 8 décembre 2025
  • Fonctionnalités :
    • Architecture LinkML en priorité
    • Intégration en direct de l'interface de programmation applicative Hestia (36 044 termes)
    • Correspondance sémantique assistée par intelligence artificielle
    • Export multi-formats (8+ formats)
    • Interface web améliorée avec support des requêtes SQL

Licence

Le Glossaire alimentaire pour l'Analyse du Cycle de Vie est sous licence MIT. Les sources de données individuelles peuvent avoir leurs propres licences.

Remerciements

  • EFSA - Système de classification alimentaire FoodEx2
  • Projet Hestia - Base de données et interface de programmation applicative d'Analyse du Cycle de Vie alimentaire
  • Association ecoinvent - Base de données d'inventaire du cycle de vie
  • FAO - Thésaurus agricole AGROvoc
  • GS1 - Vocabulaire mondial de l'emballage
  • Division de statistique de l'ONU - Codes de produits CPC et codes d'emballage UNECE

Support

Pour les questions, problèmes ou contributions :

Étapes suivantes