Ökobilanz-Lebensmittel-Glossar
Ein einheitliches Glossarsystem für Ökobilanzen im Lebensmittelbereich, das mehrere Standards mit fortschrittlichen semantischen Zuordnungsfunktionen integriert. Aufgebaut auf einer LinkML-First-Architektur für Semantic-Web-Kompatibilität und Mehrformat-Datengenerierung.
Dieses Glossar behandelt Lebensmittelklassifizierungsstandards und Ökobilanz-Datenbanken, die in der wissenschaftlichen Forschung verwendet werden.
Für EOS-Plattform-Terminologie (Systemkonzepte, Programmierschnittstellen-Begriffe, Berechnungsmethoden) siehe das EOS-Glossar.
Überblick
Das Ökobilanz-Lebensmittel-Glossar schließt die Lücke zwischen verschiedenen Lebensmittelklassifizierungssystemen und Ökobilanz-Datenbanken mit KI-gestützter semantischer Zuordnung. Dies erleichtert Forschenden, Praktikern und Organisationen die Durchführung genauer Umweltbewertungen von Lebensmittelprodukten und Lieferketten.
Wichtige Kennzahlen
- Gesamtanzahl Begriffe: 168.626
- Datenquellen: 10 integrierte Quellen
- Ausgabeformate: 8+ Formate (JSON, SQLite, RDF, TypeScript usw.)
- Datenbankgröße: 133 MB (SQLite)
- Aktuelle Version: 0.1.2
Hauptfunktionen
Multi-Quellen-Integration
Kombiniert Daten aus 10 führenden Lebensmittel- und Ökobilanz-Standards einschließlich FoodEx2, Hestia, ecoinvent, AGROvoc und weiteren. Die vollständige Dokumentation der Datenquellen enthält Begriffszahlen und Abdeckungsdetails.
Fortschrittliche semantische Zuordnung
- KI-gestützte Zuordnung - OpenAI- und Google-KI-Integration für intelligente Begriffszuordnung
- 4-Stufen-Kaskade - Kontextuelle, exakte, Synonym- und Embedding-basierte Zuordnung
- Qualitätsvalidierung - Konfidenzwertung und Qualitätsanalyse der Zuordnung
- Interaktives Debugging - Echtzeit-Visualisierung und Debugging-Werkzeuge
Mehrformat-Export
Generieren Sie Daten in mehreren Formaten für verschiedene Anwendungsfälle:
- SQLite-Datenbank - Optimiert für Abfragen und Beziehungen (133 MB)
- JSON/JSON-LD - Web-Anwendungen und Semantic-Web-Integration (189 MB)
- LinkML YAML - Natives Format mit vollständigen semantischen Annotationen (157 MB)
- TypeScript-Typen - Typsichere Integration für JavaScript/TypeScript
- RDF/OWL - Semantic-Web-Ontologien
- SQL DDL - Datenbank-Schema-Definitionen
- CSV/Excel - Datenanalyse und Tabellenkalkulation
LinkML-First-Architektur
Aufgebaut auf LinkML (Linked Data Modeling Language) als primäre Schema-Definition:
Rohdaten → Parser → LinkML YAML → Validierung → Mehrformat-Generierung
├── JSON/JSON-LD
├── TypeScript-Typen
├── RDF/OWL-Ontologien
├── SQL DDL-Schemata
└── SQLite-Datenbank
Vorteile:
- Nativ für Semantic Web mit integrierter Unterstützung für RDF, JSON-LD und SKOS
- FAIR-Datenprinzipien (Findable, Accessible, Interoperable, Reusable)
- Erweiterte Validierung mit Musterabgleich und bedingten Regeln
- Einzige Quelle der Wahrheit für alle Ausgabeformate
Anwendungsfälle
Umweltbewertung
Durchführung umfassender Ökobilanz-Studien mit standardisierter Terminologie über mehrere Lebensmittelklassifizierungssysteme hinweg.
Lieferkettenanalyse
Zuordnung von Zutaten und Prozessen aus verschiedenen Standards zur Analyse der Nachhaltigkeit entlang der gesamten Lieferkette.
Lebensmittelklassifizierung
Standardisierung von Produktbeschreibungen mit einheitlicher Terminologie aus mehreren maßgeblichen Quellen.
Forschung und akademische Studien
Zugang zu umfassendem Lebensmittel- und Ökobilanz-Vokabular mit semantischen Beziehungen für akademische Forschung.
Software-Integration
Integration mit bestehenden Ökobilanz-Werkzeugen unter Verwendung mehrerer Exportformate und typsicherer Schnittstellen.
Semantic-Web-Anwendungen
Entwicklung von Linked-Data-Anwendungen mit JSON-LD, RDF und SKOS-Vokabularen.
Schnellstart
Vorgefertigte Daten herunterladen
Das Glossar ist in mehreren Formaten verfügbar:
# SQLite-Datenbank (empfohlen für Abfragen)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.db
# JSON-Format (Web-Anwendungen)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.json
# LinkML YAML (natives Format)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.yaml
# TypeScript-Typen
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.types.ts
TypeScript/JavaScript-Integration
import { Term, Glossary } from './glossary.types'
// Glossar laden
const glossary: Glossary = await fetch('/glossary.json')
.then(r => r.json())
// Nach Begriffen suchen
const hestiaTerms = glossary.terms.filter(t => t.source === 'hestia')
console.log(`${hestiaTerms.length} Hestia-Begriffe gefunden`)
Python-Integration
from linkml_runtime.loaders import yaml_loader
from glossary_model import Glossary, Term
# Glossar laden
glossary = yaml_loader.load('glossary.yaml', target_class=Glossary)
# Begriffe abfragen
sources = set(t.source for t in glossary.terms)
print(f"{len(glossary.terms)} Begriffe aus {len(sources)} Quellen geladen")
SQL-Abfragen
-- SQLite-Datenbankabfragen
SELECT * FROM terms
WHERE source = 'hestia'
AND category LIKE '%emission%'
LIMIT 10;
-- Begriffszählung nach Quelle
SELECT source, COUNT(*) as term_count
FROM terms
GROUP BY source
ORDER BY term_count DESC;
RDF/SPARQL-Abfragen
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dc: <http://purl.org/dc/terms/>
SELECT ?term ?label ?source WHERE {
?term skos:prefLabel ?label ;
dc:source ?source .
FILTER(CONTAINS(LCASE(?label), "emission"))
}
LIMIT 10
Dokumentation
Referenzdokumentation
- Datenquellen - Vollständige Liste aller 10 integrierten Quellen mit Begriffszahlen
- FoodEx2-Referenz - EFSA-Lebensmittelklassifizierungssystem
- Hestia-Referenz - Lebensmittel-Ökobilanz-Datenbank
- ecoinvent-Referenz - Sachbilanzdatenbank
- Eaternity-Schema - EOS-Schema-Klassen und -Eigenschaften
Technische Dokumentation
- Semantische Zuordnung - KI-gestützte Begriffszuordnungsstrategien
- Datenformate - Exportformate und Integrationsbeispiele
Architektur
Projektstruktur
esfc-glossary/
├── sources/ # Quelldaten von Anbietern
│ ├── foodex2/ # FoodEx2-Excel-Dateien
│ ├── hestia/ # Live-API-Integration
│ ├── ecoinvent/ # CSV/JSON-Daten
│ ├── agrovoc/ # FAO-Thesaurus
│ └── ...
├── schema/ # LinkML-Schema-Definitionen
│ └── glossary.linkml.yaml
├── scripts/ # Datenverarbeitungs-Pipeline
│ ├── *-parser-yaml.js
│ └── build-glossary-linkml.js
├── output/ # Generierte Ausgabedateien
│ ├── glossary.db # SQLite-Datenbank
│ ├── glossary.json # JSON-Format
│ └── glossary.yaml # LinkML YAML
└── website/ # React 19 + Vite-Anwendung
└── public/ # Statische Assets
Daten-Pipeline
- Abruf - Herunterladen/Abrufen von Daten aus Live-APIs und statischen Quellen
- Parsen - Konvertierung in LinkML-YAML-Format mit semantischen Annotationen
- Validierung - Validierung gegen LinkML-Schema
- Erstellung - Zusammenführung aller Quellen in ein einheitliches Glossar
- Generierung - Export in mehrere Formate (JSON, SQLite, TypeScript, RDF)
- Bereitstellung - Veröffentlichung in der Web-Anwendung und an Download-Endpunkten
Mitwirken
Das Ökobilanz-Lebensmittel-Glossar ist ein offenes Projekt. Beiträge sind willkommen:
- Probleme melden - Fehlermeldungen und Funktionswünsche einreichen
- Datenquellen hinzufügen - Neue Lebensmittel- oder Ökobilanz-Vokabulare integrieren
- Zuordnungen verbessern - Semantische Beziehungen zwischen Begriffen erweitern
- Dokumentation aktualisieren - Diese Dokumentation verbessern
Versionshistorie
Version 0.1.2 (Aktuell)
- Gesamtanzahl Begriffe: 168.626
- Build: 6
- Zuletzt aktualisiert: 8. Dezember 2025
- Funktionen:
- LinkML-First-Architektur
- Live-Hestia-API-Integration (36.044 Begriffe)
- KI-gestützte semantische Zuordnung
- Mehrformat-Export (8+ Formate)
- Erweiterte Web-Oberfläche mit SQL-Abfrageunterstützung
Lizenz
Das Ökobilanz-Lebensmittel-Glossar ist unter der MIT-Lizenz lizenziert. Einzelne Datenquellen können eigene Lizenzen haben.
Danksagungen
- EFSA - FoodEx2-Lebensmittelklassifizierungssystem
- Hestia-Projekt - Lebensmittel-Ökobilanz-Datenbank und API
- ecoinvent Association - Sachbilanzdatenbank
- FAO - AGROvoc-Landwirtschaftsthesaurus
- GS1 - Globales Verpackungsvokabular
- UN-Statistikabteilung - CPC-Warencodes und UNECE-Verpackungscodes
Unterstützung
Bei Fragen, Problemen oder Beiträgen:
- Dokumentation: esfc-glossary-ec2bc9.gitlab.io
- Repository: GitLab (privat)
- Kontakt: Eaternity-Team
Nächste Schritte
- Datenquellen erkunden - Informationen zu allen 10 integrierten Quellen
- Formate herunterladen - Das Glossar im bevorzugten Format erhalten
- Semantische Zuordnung - Das KI-gestützte Zuordnungssystem verstehen