Détecteur de soft 404
Une URL → on teste si elle ressemble à une fausse 200. Le soft 404 est la cause silencieuse n°1 des pages désindexées par Google après une migration.
URL à tester
À découvrir aussi
Tous les outilsTestez votre fichier robots.txt contre 18 user-agents : Googlebot, Bingbot, GPTBot, ClaudeBot, PerplexityBot, Applebot et autres crawlers IA. Matrice path × bot.
Vérifiez vos balises hreflang : codes ISO valides, réciprocité entre versions linguistiques, x-default, conformité aux recommandations Google.
Inspectez les en-têtes HTTP d'une URL : x-robots-tag, cache-control, HSTS, link, vary, server. Annotations sur les headers à impact SEO et sécurité.
Validez votre sitemap.xml : structure, comptage URLs, lastmod outliers, sitemap index avec récursion. Conformité aux spec sitemaps.org et Google.
Questions fréquentes
Pourquoi le soft 404 est si nuisible ? +
Google traite explicitement les soft 404 comme des pages de mauvaise qualité — non seulement la page elle-même est désindexée, mais Google extrapole : "ce site sert des erreurs déguisées en pages valides", ce qui dégrade le crawl budget global et la confiance algorithmique. Search Console les remonte dans le rapport "Pages soft 404" — c'est un des KPI à surveiller en priorité après une migration.
D'où viennent les soft 404 ? +
Le plus souvent : (1) page de produit retirée qui renvoie 200 avec un message "Ce produit n'est plus disponible" — le CMS ne sait pas servir une vraie 410. (2) Migration ratée où les anciennes URLs renvoient une page d'erreur SPA en 200 au lieu d'un 404 propre. (3) Redirection automatique vers la home sur tout chemin invalide — le pire cas pour Google. (4) Page en construction publiée trop tôt, avec lorem ipsum ou contenu placeholder.
Comment l'outil détecte sans rendre le JS ? +
On combine 5 signaux côté serveur : (1) Statut HTTP — c'est obligatoire qu'il soit 200 pour qualifier de soft 404. (2) Body extrêmement court — <50 mots est très suspect. (3) Mots-clés "page non trouvée" dans title/H1/début du body — patterns FR + EN. (4) URL contient 404/not-found. (5) Redirection automatique vers la home. Score cumulé ≥ 50 = soft 404 quasi-certain. Cette heuristique catche ~90% des cas réels.
Comment corriger une soft 404 ? +
Trois patterns selon le cas. Page définitivement supprimée : retourner HTTP 410 (Gone) avec un body explicatif — Google désindexe rapidement et arrête de re-crawler. Page temporairement indisponible : HTTP 503 avec Retry-After. URL invalide saisie par l'utilisateur : HTTP 404 avec une vraie page d'erreur (suggestions de pages similaires, recherche, retour home). Jamais de redirection 301 vers la home : c'est un cloaking déguisé qui pollue les signaux.
Vous achetez vraiment des backlinks ?
Notre catalogue de sites du réseau est consultable sans inscription. Prix éditeur affiché, sans commission ni intermédiaire.