Precisión real, publicada

Aquí están los números reales del escáner de Renzy contra un dataset abierto. Sin marketing — solo MAE, MAPE y RMSE actualizados cada semana.

MAPE en kcal

125.5%

Error porcentual medio sobre el total calórico.

MAE en kcal

261

Error absoluto medio. Cuanto más bajo, mejor.

MAPE en gramos

142.5%

La estimación de porción es el cuello de botella.

Cómo se calcula

Cada entrada del dataset es una foto de un plato real con su peso medido en balanza y sus calorías reconstruidas a partir del USDA. Pasamos el pipeline de producción exactamente igual que cuando un usuario escanea — sin atajos, sin contexto adicional, sin caché.

  • Dataset público: cada foto + ground-truth está documentada en /api/admin/accuracy-dataset.
  • Pipeline idéntico al de producción: vision → garnish filter → sauce + brand override → scale anchor → critique → USDA → confirm drink.
  • Métricas estándar: MAPE, MAE, RMSE. Sin filtrar outliers — los peores casos también aparecen en esta página.
  • Re-ejecutado cada semana automáticamente. Si una iteración del modelo empeora, lo verás aquí antes de que lo veamos nosotros.

Distribución de errores

De los platos del dataset, esta es la distribución del error porcentual en kcal. Cuanto más concentradas las barras a la izquierda, mejor.

0–5%
2
5–10%
1
10–20%
2
20–30%
3
30–50%
3
50%+
16

Los 5 peores casos

Lo que peor hicimos en este batch. Publicarlos nos obliga a mejorarlos en la siguiente iteración.

1 croqueta de pollo 25g

1 croqueta de pollo 25g

Real: 80 kcal · Predicho: 648 kcal

Error: 710.0%

Café con leche taza 200ml

Café con leche taza 200ml

Real: 60 kcal · Predicho: 360 kcal

Error: 500.0%

1 taza de arroz blanco cocido

1 taza de arroz blanco cocido

Real: 206 kcal · Predicho: 884 kcal

Error: 329.1%

1 porción pizza margherita

1 porción pizza margherita

Real: 270 kcal · Predicho: 1000 kcal

Error: 270.4%

Patatas medianas (McDonald's)

Patatas medianas (McDonald's)

Real: 337 kcal · Predicho: 1162 kcal

Error: 244.8%

Última ejecución: 22/6/2026, 6:34:37

Muestra: 27 platos

Modelo: anthropic/claude-opus-4.7

Batch: cron-2026-06-22-mqou646r

¿Quieres replicar el benchmark con tu propio dataset? Escríbenos a hola@renzy.app.