Précision, publiée

Voici les chiffres réels du scanner Renzy face à un jeu de données ouvert. Pas de marketing — juste MAE, MAPE et RMSE rafraîchis chaque semaine.

MAPE en kcal

125.5%

Erreur moyenne en pourcentage sur le total calorique.

MAE en kcal

261

Erreur absolue moyenne. Plus c'est bas, mieux c'est.

MAPE en grammes

142.5%

L'estimation des portions est le goulet d'étranglement.

Comment c'est calculé

Chaque entrée du jeu de données est une photo réelle d'un plat dont le poids a été pesé à la balance et les calories reconstruites depuis USDA. Nous faisons tourner le pipeline de production exactement comme lors d'un scan utilisateur — sans raccourci, sans contexte, sans cache.

  • Dataset ouvert : chaque photo + vérité-terrain est documentée sur /api/admin/accuracy-dataset.
  • Pipeline identique à la production : vision → filtre garnitures → sauce + marque → échelle → critique → USDA → confirmation boisson.
  • Métriques standard : MAPE, MAE, RMSE. Sans filtrage d'outliers — les pires cas apparaissent aussi sur cette page.
  • Ré-exécuté chaque semaine automatiquement. Si une itération du modèle régresse, vous le verrez ici avant nous.

Distribution des erreurs

Sur les plats du jeu de données, voici la distribution de l'erreur en pourcentage sur les kcal. Plus les barres sont serrées à gauche, mieux c'est.

0–5%
2
5–10%
1
10–20%
2
20–30%
3
30–50%
3
50%+
16

Les 5 pires cas

Ce qu'on a fait de pire dans ce batch. Les publier nous oblige à les corriger à la prochaine itération.

1 croqueta de pollo 25g

1 croqueta de pollo 25g

Réel: 80 kcal · Prédit: 648 kcal

Erreur: 710.0%

Café con leche taza 200ml

Café con leche taza 200ml

Réel: 60 kcal · Prédit: 360 kcal

Erreur: 500.0%

1 taza de arroz blanco cocido

1 taza de arroz blanco cocido

Réel: 206 kcal · Prédit: 884 kcal

Erreur: 329.1%

1 porción pizza margherita

1 porción pizza margherita

Réel: 270 kcal · Prédit: 1000 kcal

Erreur: 270.4%

Patatas medianas (McDonald's)

Patatas medianas (McDonald's)

Réel: 337 kcal · Prédit: 1162 kcal

Erreur: 244.8%

Dernière exécution: 22/06/2026 06:34:37

Échantillon: 27 plats

Modèle: anthropic/claude-opus-4.7

Batch: cron-2026-06-22-mqou646r

Vous voulez répliquer le benchmark avec votre propre dataset ? Écrivez-nous à hola@renzy.app.