Ces derniers jours, en me rendant dans la Google Search Console, je me suis rendu compte que j’avais quelques milliers d’articles qui étaient indexés par Google mais sans être présents dans aucune sitemap.
Il s’agit en fait des articles de tablatures de guitare: au lieu de publier un article pour chaque tablatures, le site crée à la volée un article WordPress qui contient la tablature en question. C’est très efficace mais cela ne permet évidemment pas de les ajouter au fichier sitemap par défaut.
Si vous avez ce genre de configuration – ou si vous avez d’autres liens à soumettre à Google, voici ce que j’ai utilisé cette semaine.
État des lieux
On commence par se connecter à la Search Console pour se rendre dans Coverage > Valid > Indexed, not submitted in sitemap.
Voici un petit graphique qui montre les 1658 pages au 26 juillet et après soumission de la première sitemap – 1000 liens, car cela semble être la limite de l’export de la Search console, un premier résultat positif:
Export de la liste des articles
Tout en haut de la page, cliquez sur le bouton Export et sélectionnez Download CSV:
Cela lance le téléchargement d’un fichier zip. Décompressez l’archive et ouvrez le fichier Table.csv
dans votre tableur préféré.
Préparation du fichier CSV
Le fichier CSV généré par la Search Console ne contient que deux colonnes: URL et Last crawled (date de la dernière visite GoogleBot).
Nous allons utiliser un service en ligne qui requiert deux colonnes supplémentaires: changefreq (fréquence de mise à jour) et priority (priorité par rapport à d’autres pages).
Commencez par créer les deux nouvelles colonnes. Je mets monthly dans la colonne changefreq et 0.5 dans la colonne priority pour chaque élément du tableau.
Pro-tip: écrivez-les une fois dans le premier élément et étirez la cellule vers le bas jusqu’au dernier élément du tableau, cela recopiera la valeur pour toute la colonne.
Enregistrez votre fichier CSV. Ouvrez-le maintenant avec un simple éditeur de texte puis supprimez la première ligne, qui contient le nom des colonnes du tableau. La ligne devrait ressembler à URL;Last crawled;changefreq;priority
.
Cherchez et remplacez tous les points-virgule (;
) et remplacez-les par le caractère pipe (|
).
Enregistrez vos modifications. Changez l’extension du fichier: troquez l’extension .csv
pour l’extension .txt
Votre fichier est prêt!
Conversion du fichier CSV en fichier sitemap.xml
C’est la partie la plus simple: nous allons utiliser un outil en ligne, MobileFish Sitemap Generator :
Choisissez la méthode 2, uploadez votre fichier CSV (au format .txt). Cliquez sur Start et ensuite sur Download sitemap.xml pour télécharger votre nouveau fichier de sitemap.
Ajout du fichier sitemap à la Search Console
Il ne vous reste plus qu’à soumettre votre fichier sitemap dans Search Console > Sitemaps.
N’oubliez pas de l’ajouter également dans votre fichier robots.txt avec la syntaxe suivante:
Sitemap: https://example.com/sitemap.xml
Code language: JavaScript (javascript)
Conclusion
Voilà, nous venons de créer un nouveau fichier sitemap pour les pages que Google avait détecté mais que nous ne lui avions pas soumis explicitement via une sitemap.
Une fois que Google a digéré votre nouveau fichier, les pages changeront de catégorie et basculeront dans Submitted and indexed. Cela n’a pris que quelques heures ou une journée chez moi:
Recherchez-vous un expert WordPress ou WooCommerce sur qui vous pouvez compter? Ne cherchez plus.