diff --git a/api.php b/api.php index 6e86e28..d81ca13 100644 --- a/api.php +++ b/api.php @@ -116,7 +116,7 @@ function emptyPhysicalResult() { ]; } -// ── NOUVELLE FONCTION : SCRAPPING GO-UPC.COM (MODIFIÉE) ── +// ── NOUVELLE FONCTION : SCRAPPING GO-UPC.COM (CORRIGÉE) ── function fetchFromGoUpc($ean) { $empty = emptyPhysicalResult(); $url = "https://go-upc.com/search?q=" . urlencode($ean); @@ -128,21 +128,45 @@ function fetchFromGoUpc($ean) { $empty['title'] = trim(strip_tags($m[1])); } elseif (preg_match('/]*>([^<]+)<\/title>/i', $html, $m)) { $title = trim($m[1]); + $title = preg_replace('/\s*[-–]\s*EAN\s+\d+\s*[-–]\s*Go-UPC.*$/i', '', $title); $title = preg_replace('/\s*[-–]\s*Go-UPC.*$/i', '', $title); $empty['title'] = $title; } - // ✅ RÉCUPÉRATION DE L'IMAGE DEPUIS GO-UPC - // Chercher dans les figures product-image - if (preg_match('/]*class="product-image[^"]*"[^>]*>.*?]*src="([^"]+\.(?:jpg|jpeg|png|webp))"/is', $html, $m)) { + // ✅ RÉCUPÉRATION DE L'IMAGE DEPUIS GO-UPC (VERSION ROBUSTE) + // 1. Chercher directement l'URL Amazon S3 de go-upc (plus fiable) + if (preg_match('/src="(https:\/\/go-upc\.s3\.amazonaws\.com\/images\/[^"]+)"/i', $html, $m)) { $empty['poster'] = trim($m[1]); - } elseif (preg_match('/]*src="([^"]+go-upc\.s3\.amazonaws\.com[^"]+)"/i', $html, $m)) { + } + // 2. Fallback : chercher dans les figures product-image + elseif (preg_match('/]*class="product-image[^"]*"[^>]*>.*?]*src="([^"]+)"/is', $html, $m)) { + $empty['poster'] = trim($m[1]); + } + // 3. Fallback : chercher toute image de go-upc.s3.amazonaws.com + elseif (preg_match('/src="([^"]+go-upc\.s3\.amazonaws\.com[^"]+)"/i', $html, $m)) { $empty['poster'] = trim($m[1]); } // Nettoyage du titre if (!empty($empty['title'])) { $empty['title'] = html_entity_decode($empty['title'], ENT_QUOTES | ENT_HTML5, 'UTF-8'); + + // ✅ APPLIQUER cleanTitle() pour supprimer les suffixes comme "- DVD", "- Édition Collector" + $empty['title'] = cleanTitle($empty['title']); + + // ✅ Supprimer le nom du réalisateur au début si présent + // Pattern : "Prénom Nom Titre du film" → "Titre du film" + if (preg_match('/^([A-ZÀ-Ÿ][a-zà-ÿ]+\s+[A-ZÀ-Ÿ][a-zà-ÿ]+)\s+(.+)$/u', $empty['title'], $nameMatch)) { + $possibleDirector = $nameMatch[1]; + $possibleTitle = $nameMatch[2]; + + // Vérifier si le "titre" restant semble être un vrai titre (pas juste un mot) + if (strlen($possibleTitle) > 3 && !preg_match('/^(DVD|Blu-ray|4K|VHS|CD|Vinyl)$/i', $possibleTitle)) { + $empty['director'] = $possibleDirector; + $empty['title'] = $possibleTitle; + } + } + $empty['title'] = trim($empty['title']); }