Glosario de Alimentos para Analisis del Ciclo de Vida
Un sistema de glosario unificado para el Analisis del Ciclo de Vida en alimentos, que integra multiples estandares con capacidades avanzadas de mapeo semantico. Construido sobre una arquitectura LinkML-first para compatibilidad con la web semantica y generacion de datos en multiples formatos.
Este glosario cubre estandares de clasificacion de alimentos y bases de datos de Analisis del Ciclo de Vida utilizados en investigacion cientifica.
Para terminologia de la plataforma EOS (conceptos del sistema, terminos de la interfaz de programacion de aplicaciones, metodos de calculo), consultad el Glosario de EOS.
Vision general
El Glosario de Alimentos para Analisis del Ciclo de Vida conecta diferentes sistemas de clasificacion de alimentos y bases de datos de Analisis del Ciclo de Vida con mapeo semantico potenciado por inteligencia artificial, facilitando a investigadores, profesionales y organizaciones la realizacion de evaluaciones ambientales precisas de productos alimentarios y cadenas de suministro.
Estadisticas clave
- Total de terminos: 168.626
- Fuentes de datos: 10 fuentes integradas
- Formatos de salida: 8+ formatos (JSON, SQLite, RDF, TypeScript, etc.)
- Tamano de la base de datos: 133 MB (SQLite)
- Version actual: 0.1.2
Caracteristicas principales
Integracion multifuente
Combina datos de 10 estandares lideres en alimentos y Analisis del Ciclo de Vida incluyendo FoodEx2, Hestia, ecoinvent, AGROvoc, y mas. Consultad la documentacion completa de Fuentes de datos para conocer el recuento de terminos y detalles de cobertura.
Mapeo semantico avanzado
- Coincidencia potenciada por inteligencia artificial - Integracion con OpenAI y Google AI para coincidencia inteligente de terminos
- Cascada de 4 etapas - Coincidencia contextual, exacta, por sinonimos y basada en embeddings
- Validacion de calidad - Puntuacion de confianza y analisis de calidad de coincidencias
- Depuracion interactiva - Herramientas de visualizacion y depuracion de coincidencias en tiempo real
Exportacion multiformato
Generad datos en multiples formatos para diferentes casos de uso:
- Base de datos SQLite - Optimizada para consultas y relaciones (133 MB)
- JSON/JSON-LD - Aplicaciones web e integracion con la web semantica (189 MB)
- LinkML YAML - Formato nativo con anotaciones semanticas completas (157 MB)
- Tipos TypeScript - Integracion con seguridad de tipos para JavaScript/TypeScript
- RDF/OWL - Ontologias de la web semantica
- SQL DDL - Definiciones de esquemas de bases de datos
- CSV/Excel - Analisis de datos y aplicaciones de hojas de calculo
Arquitectura LinkML-first
Construido sobre LinkML (Linked Data Modeling Language) como definicion de esquema principal:
Datos sin procesar -> Analizador -> LinkML YAML -> Validacion -> Generacion multiformato
├── JSON/JSON-LD
├── Tipos TypeScript
├── Ontologias RDF/OWL
├── Esquemas SQL DDL
└── Base de datos SQLite
Beneficios:
- Nativo de la web semantica con soporte integrado para RDF, JSON-LD y SKOS
- Principios FAIR de datos (Encontrable, Accesible, Interoperable, Reutilizable)
- Validacion mejorada con coincidencia de patrones y reglas condicionales
- Fuente unica de verdad para todos los formatos de salida
Casos de uso
Evaluacion del impacto ambiental
Realizad estudios completos de Analisis del Ciclo de Vida con terminologia estandarizada a traves de multiples sistemas de clasificacion de alimentos.
Analisis de la cadena de suministro
Mapeadad ingredientes y procesos de diferentes estandares para analizar la sostenibilidad a lo largo de toda la cadena de suministro.
Clasificacion de productos alimentarios
Estandarizad descripciones de productos utilizando terminologia unificada de multiples fuentes autorizadas.
Investigacion y estudios academicos
Acceded a vocabulario completo de alimentos y Analisis del Ciclo de Vida con relaciones semanticas para investigacion academica.
Integracion de software
Integrad con herramientas existentes de Analisis del Ciclo de Vida utilizando multiples formatos de exportacion e interfaces con seguridad de tipos.
Aplicaciones de la web semantica
Construid aplicaciones de datos enlazados utilizando vocabularios JSON-LD, RDF y SKOS.
Inicio rapido
Descargar datos preconstruidos
El glosario esta disponible en multiples formatos:
# Base de datos SQLite (recomendado para consultas)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.db
# Formato JSON (aplicaciones web)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.json
# LinkML YAML (formato nativo)
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.yaml
# Tipos TypeScript
wget https://esfc-glossary-ec2bc9.gitlab.io/downloads/glossary.types.ts
Integracion TypeScript/JavaScript
import { Term, Glossary } from './glossary.types'
// Cargar datos del glosario
const glossary: Glossary = await fetch('/glossary.json')
.then(r => r.json())
// Buscar terminos
const hestiaTerms = glossary.terms.filter(t => t.source === 'hestia')
console.log(`Encontrados ${hestiaTerms.length} terminos de Hestia`)
Integracion Python
from linkml_runtime.loaders import yaml_loader
from glossary_model import Glossary, Term
# Cargar glosario
glossary = yaml_loader.load('glossary.yaml', target_class=Glossary)
# Consultar terminos
sources = set(t.source for t in glossary.terms)
print(f"Cargados {len(glossary.terms)} terminos de {len(sources)} fuentes")
Consultas SQL
-- Consultas a la base de datos SQLite
SELECT * FROM terms
WHERE source = 'hestia'
AND category LIKE '%emission%'
LIMIT 10;
-- Obtener recuento de terminos por fuente
SELECT source, COUNT(*) as term_count
FROM terms
GROUP BY source
ORDER BY term_count DESC;
Consultas RDF/SPARQL
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX dc: <http://purl.org/dc/terms/>
SELECT ?term ?label ?source WHERE {
?term skos:prefLabel ?label ;
dc:source ?source .
FILTER(CONTAINS(LCASE(?label), "emission"))
}
LIMIT 10
Documentacion
Documentacion de referencia
- Fuentes de datos - Lista completa de las 10 fuentes integradas con recuento de terminos
- Referencia de FoodEx2 - Sistema de clasificacion de alimentos de la Autoridad Europea de Seguridad Alimentaria
- Referencia de Hestia - Base de datos de Analisis del Ciclo de Vida de alimentos
- Referencia de ecoinvent - Base de datos de Inventario del Ciclo de Vida
- Esquema de Eaternity - Clases y propiedades del esquema EOS
Documentacion tecnica
- Mapeo semantico - Estrategias de coincidencia de terminos potenciadas por inteligencia artificial
- Formatos de datos - Formatos de exportacion y ejemplos de integracion
Arquitectura
Estructura del proyecto
esfc-glossary/
├── sources/ # Datos fuente de proveedores
│ ├── foodex2/ # Archivos Excel de FoodEx2
│ ├── hestia/ # Integracion con interfaz de programacion de aplicaciones en vivo
│ ├── ecoinvent/ # Datos CSV/JSON
│ ├── agrovoc/ # Tesauro de la FAO
│ └── ...
├── schema/ # Definiciones del esquema LinkML
│ └── glossary.linkml.yaml
├── scripts/ # Pipeline de procesamiento de datos
│ ├── *-parser-yaml.js
│ └── build-glossary-linkml.js
├── output/ # Archivos de salida generados
│ ├── glossary.db # Base de datos SQLite
│ ├── glossary.json # Formato JSON
│ └── glossary.yaml # LinkML YAML
└── website/ # Aplicacion React 19 + Vite
└── public/ # Activos estaticos
Pipeline de datos
- Obtener - Descargar/obtener datos de interfaces de programacion de aplicaciones en vivo y fuentes estaticas
- Analizar - Convertir a formato LinkML YAML con anotaciones semanticas
- Validar - Validar contra el esquema LinkML
- Construir - Fusionar todas las fuentes en un glosario unificado
- Generar - Exportar a multiples formatos (JSON, SQLite, TypeScript, RDF)
- Desplegar - Publicar en la aplicacion web y puntos de descarga
Contribuir
El Glosario de Alimentos para Analisis del Ciclo de Vida es un proyecto abierto. Las contribuciones son bienvenidas:
- Informar de problemas - Enviad informes de errores y solicitudes de caracteristicas
- Anadir fuentes de datos - Integrad nuevos vocabularios de alimentos o Analisis del Ciclo de Vida
- Mejorar mapeos - Mejoras las relaciones semanticas entre terminos
- Actualizar documentacion - Ayudad a mejorar esta documentacion
Historial de versiones
Version 0.1.2 (actual)
- Total de terminos: 168.626
- Compilacion: 6
- Ultima actualizacion: 8 de diciembre de 2025
- Caracteristicas:
- Arquitectura LinkML-first
- Integracion en vivo con la interfaz de programacion de aplicaciones de Hestia (36.044 terminos)
- Coincidencia semantica potenciada por inteligencia artificial
- Exportacion multiformato (8+ formatos)
- Interfaz web mejorada con soporte de consultas SQL
Licencia
El Glosario de Alimentos para Analisis del Ciclo de Vida esta licenciado bajo la Licencia MIT. Las fuentes de datos individuales pueden tener sus propias licencias.
Agradecimientos
- Autoridad Europea de Seguridad Alimentaria - Sistema de clasificacion de alimentos FoodEx2
- Proyecto Hestia - Base de datos e interfaz de programacion de aplicaciones de Analisis del Ciclo de Vida de alimentos
- Asociacion ecoinvent - Base de datos de Inventario del Ciclo de Vida
- FAO - Tesauro agricola AGROvoc
- GS1 - Vocabulario global de embalaje
- Division de Estadistica de las Naciones Unidas - Codigos de productos CPC y codigos de embalaje UNECE
Soporte
Para preguntas, problemas o contribuciones:
- Documentacion: esfc-glossary-ec2bc9.gitlab.io
- Repositorio: GitLab (privado)
- Contacto: Equipo de Eaternity
Proximos pasos
- Explorar fuentes de datos - Conoced las 10 fuentes integradas
- Descargar formatos - Obtened el glosario en vuestro formato preferido
- Mapeo semantico - Entended el sistema de coincidencia potenciado por inteligencia artificial