Zum Hauptinhalt springen

Ökobilanz-Lebensmittel-Glossar

Ein einheitliches Glossarsystem für Ökobilanzen im Lebensmittelbereich, das mehrere Standards mit fortschrittlichen semantischen Zuordnungsfunktionen integriert. Aufgebaut auf einer LinkML-First-Architektur für Semantic-Web-Kompatibilität und Mehrformat-Datengenerierung.

Suchen Sie nach Plattform-Terminologie?

Dieses Glossar behandelt Lebensmittelklassifizierungsstandards und Ökobilanz-Datenbanken, die in der wissenschaftlichen Forschung verwendet werden.

Für EOS-Plattform-Terminologie (Systemkonzepte, Programmierschnittstellen-Begriffe, Berechnungsmethoden) siehe das EOS-Glossar.

Überblick

Das Ökobilanz-Lebensmittel-Glossar schließt die Lücke zwischen verschiedenen Lebensmittelklassifizierungssystemen und Ökobilanz-Datenbanken mit KI-gestützter semantischer Zuordnung. Dies erleichtert Forschenden, Praktikern und Organisationen die Durchführung genauer Umweltbewertungen von Lebensmittelprodukten und Lieferketten.

Wichtige Kennzahlen

  • Gesamtanzahl Begriffe: 168.626
  • Datenquellen: 10 integrierte Quellen
  • Ausgabeformate: 8+ Formate (JSON, SQLite, RDF, TypeScript usw.)
  • Datenbankgröße: 133 MB (SQLite)
  • Aktuelle Version: 0.1.2

Hauptfunktionen

Multi-Quellen-Integration

Kombiniert Daten aus 10 führenden Lebensmittel- und Ökobilanz-Standards einschließlich FoodEx2, Hestia, ecoinvent, AGROvoc und weiteren. Die vollständige Dokumentation der Datenquellen enthält Begriffszahlen und Abdeckungsdetails.

Fortschrittliche semantische Zuordnung

  • KI-gestützte Zuordnung - OpenAI- und Google-KI-Integration für intelligente Begriffszuordnung
  • 4-Stufen-Kaskade - Kontextuelle, exakte, Synonym- und Embedding-basierte Zuordnung
  • Qualitätsvalidierung - Konfidenzwertung und Qualitätsanalyse der Zuordnung
  • Interaktives Debugging - Echtzeit-Visualisierung und Debugging-Werkzeuge

Mehrformat-Export

Generieren Sie Daten in mehreren Formaten für verschiedene Anwendungsfälle:

  • SQLite-Datenbank - Optimiert für Abfragen und Beziehungen (133 MB)
  • JSON/JSON-LD - Web-Anwendungen und Semantic-Web-Integration (189 MB)
  • LinkML YAML - Natives Format mit vollständigen semantischen Annotationen (157 MB)
  • TypeScript-Typen - Typsichere Integration für JavaScript/TypeScript
  • RDF/OWL - Semantic-Web-Ontologien
  • SQL DDL - Datenbank-Schema-Definitionen
  • CSV/Excel - Datenanalyse und Tabellenkalkulation

LinkML-First-Architektur

Aufgebaut auf LinkML (Linked Data Modeling Language) als primäre Schema-Definition:

Rohdaten → Parser → LinkML YAML → Validierung → Mehrformat-Generierung
├── JSON/JSON-LD
├── TypeScript-Typen
├── RDF/OWL-Ontologien
├── SQL DDL-Schemata
└── SQLite-Datenbank

Vorteile:

  • Nativ für Semantic Web mit integrierter Unterstützung für RDF, JSON-LD und SKOS
  • FAIR-Datenprinzipien (Findable, Accessible, Interoperable, Reusable)
  • Erweiterte Validierung mit Musterabgleich und bedingten Regeln
  • Einzige Quelle der Wahrheit für alle Ausgabeformate

Anwendungsfälle

Umweltbewertung

Durchführung umfassender Ökobilanz-Studien mit standardisierter Terminologie über mehrere Lebensmittelklassifizierungssysteme hinweg.

Lieferkettenanalyse

Zuordnung von Zutaten und Prozessen aus verschiedenen Standards zur Analyse der Nachhaltigkeit entlang der gesamten Lieferkette.

Lebensmittelklassifizierung

Standardisierung von Produktbeschreibungen mit einheitlicher Terminologie aus mehreren maßgeblichen Quellen.

Forschung und akademische Studien

Zugang zu umfassendem Lebensmittel- und Ökobilanz-Vokabular mit semantischen Beziehungen für akademische Forschung.

Software-Integration

Integration mit bestehenden Ökobilanz-Werkzeugen unter Verwendung mehrerer Exportformate und typsicherer Schnittstellen.

Semantic-Web-Anwendungen

Entwicklung von Linked-Data-Anwendungen mit JSON-LD, RDF und SKOS-Vokabularen.

Schnellstart

Vorgefertigte Daten herunterladen

Das Glossar ist in mehreren Formaten verfügbar:

# SQLite-Datenbank (empfohlen für Abfragen)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.db

# JSON-Format (Web-Anwendungen)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.json

# LinkML YAML (natives Format)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.yaml

# TypeScript-Typen
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.types.ts

TypeScript/JavaScript-Integration

import { Term, Glossary } from './glossary.types'

// Glossar laden
const glossary: Glossary = await fetch('/glossary.json')
.then(r => r.json())

// Nach Begriffen suchen
const hestiaTerms = glossary.terms.filter(t => t.source === 'hestia')
console.log(`${hestiaTerms.length} Hestia-Begriffe gefunden`)

Python-Integration

from linkml_runtime.loaders import yaml_loader
from glossary_model import Glossary, Term

# Glossar laden
glossary = yaml_loader.load('glossary.yaml', target_class=Glossary)

# Begriffe abfragen
sources = set(t.source for t in glossary.terms)
print(f"{len(glossary.terms)} Begriffe aus {len(sources)} Quellen geladen")

SQL-Abfragen

-- SQLite-Datenbankabfragen
SELECT * FROM terms
WHERE source = 'hestia'
AND category LIKE '%emission%'
LIMIT 10;

-- Begriffszählung nach Quelle
SELECT source, COUNT(*) as term_count
FROM terms
GROUP BY source
ORDER BY term_count DESC;

RDF/SPARQL-Abfragen

PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dc: <http://purl.org/dc/terms/>

SELECT ?term ?label ?source WHERE {
?term skos:prefLabel ?label ;
dc:source ?source .
FILTER(CONTAINS(LCASE(?label), "emission"))
}
LIMIT 10

Dokumentation

Referenzdokumentation

Technische Dokumentation

Architektur

Projektstruktur

esfc-glossary/
├── sources/ # Quelldaten von Anbietern
│ ├── foodex2/ # FoodEx2-Excel-Dateien
│ ├── hestia/ # Live-API-Integration
│ ├── ecoinvent/ # CSV/JSON-Daten
│ ├── agrovoc/ # FAO-Thesaurus
│ └── ...
├── schema/ # LinkML-Schema-Definitionen
│ └── glossary.linkml.yaml
├── scripts/ # Datenverarbeitungs-Pipeline
│ ├── *-parser-yaml.js
│ └── build-glossary-linkml.js
├── output/ # Generierte Ausgabedateien
│ ├── glossary.db # SQLite-Datenbank
│ ├── glossary.json # JSON-Format
│ └── glossary.yaml # LinkML YAML
└── website/ # React 19 + Vite-Anwendung
└── public/ # Statische Assets

Daten-Pipeline

  1. Abruf - Herunterladen/Abrufen von Daten aus Live-APIs und statischen Quellen
  2. Parsen - Konvertierung in LinkML-YAML-Format mit semantischen Annotationen
  3. Validierung - Validierung gegen LinkML-Schema
  4. Erstellung - Zusammenführung aller Quellen in ein einheitliches Glossar
  5. Generierung - Export in mehrere Formate (JSON, SQLite, TypeScript, RDF)
  6. Bereitstellung - Veröffentlichung in der Web-Anwendung und an Download-Endpunkten

Mitwirken

Das Ökobilanz-Lebensmittel-Glossar ist ein offenes Projekt. Beiträge sind willkommen:

  • Probleme melden - Fehlermeldungen und Funktionswünsche einreichen
  • Datenquellen hinzufügen - Neue Lebensmittel- oder Ökobilanz-Vokabulare integrieren
  • Zuordnungen verbessern - Semantische Beziehungen zwischen Begriffen erweitern
  • Dokumentation aktualisieren - Diese Dokumentation verbessern

Versionshistorie

Version 0.1.2 (Aktuell)

  • Gesamtanzahl Begriffe: 168.626
  • Build: 6
  • Zuletzt aktualisiert: 8. Dezember 2025
  • Funktionen:
    • LinkML-First-Architektur
    • Live-Hestia-API-Integration (36.044 Begriffe)
    • KI-gestützte semantische Zuordnung
    • Mehrformat-Export (8+ Formate)
    • Erweiterte Web-Oberfläche mit SQL-Abfrageunterstützung

Lizenz

Das Ökobilanz-Lebensmittel-Glossar ist unter der MIT-Lizenz lizenziert. Einzelne Datenquellen können eigene Lizenzen haben.

Danksagungen

  • EFSA - FoodEx2-Lebensmittelklassifizierungssystem
  • Hestia-Projekt - Lebensmittel-Ökobilanz-Datenbank und API
  • ecoinvent Association - Sachbilanzdatenbank
  • FAO - AGROvoc-Landwirtschaftsthesaurus
  • GS1 - Globales Verpackungsvokabular
  • UN-Statistikabteilung - CPC-Warencodes und UNECE-Verpackungscodes

Unterstützung

Bei Fragen, Problemen oder Beiträgen:

Nächste Schritte