Créer un fichier sitemap à partir d'une liste d'articles pour le soumettre sur Google Search Console photo 4

Créer un fichier sitemap à partir d’une liste d’articles pour le soumettre sur Google Search Console

Ces derniers jours, en me rendant dans la Google Search Console, je me suis rendu compte que j’avais quelques milliers d’articles qui étaient indexés par Google mais sans être présents dans aucune sitemap.

Il s’agit en fait des articles de tablatures de guitare: au lieu de publier un article pour chaque tablatures, le site crée à la volée un article WordPress qui contient la tablature en question. C’est très efficace mais cela ne permet évidemment pas de les ajouter au fichier sitemap par défaut.

Si vous avez ce genre de configuration – ou si vous avez d’autres liens à soumettre à Google, voici ce que j’ai utilisé cette semaine.

État des lieux

On commence par se connecter à la Search Console pour se rendre dans Coverage > Valid > Indexed, not submitted in sitemap.

Voici un petit graphique qui montre les 1658 pages au 26 juillet et après soumission de la première sitemap – 1000 liens, car cela semble être la limite de l’export de la Search console, un premier résultat positif:

google search console coverage indexed not submitted in sitemap 1280x746

Export de la liste des articles

Tout en haut de la page, cliquez sur le bouton Export et sélectionnez Download CSV:

google search console coverage indexed not submitted in sitemap export 1280x447

Cela lance le téléchargement d’un fichier zip. Décompressez l’archive et ouvrez le fichier Table.csv dans votre tableur préféré.

Lire la suite

nexus7

Ma première tablette : Google Nexus 7

Et voilà, depuis le temps que j’en voulais une… j’ai attendu patiemment que Google sorte la Nexus 7 qui, grâce à la magie de Noël (et de mes parents!) est enfin mienne.

La tablette en elle-même est plutôt belle d’aspect : bords arrondis argentés et coque arrière en plastique agréable au toucher (style grip et non un plastique brillant qui glisse entre les doigts – bon point!). L’écran est sublime, extrêmement précis et réactif.

Niveau performance, rien à voir avec la tablette chinoise que j’avais achetée à mon père il y a quelques mois:

  • écran 7” 1280×800 (216ppi)
  • 32Go de disque
  • 1 Go de RAM
  • NVIDIA Tegra3 quad-core processor
  • camera 1.2MP

Le tout tournant évidemment sous Android. Au premier démarrage, j’ai entré la clé WiFi de la maison puis mes identifiants Google : la tablette a alors récupéré toute la liste des applications installées sur mon téléphone et les a installées automatiquement sur la tablette.

Au début, je me suis demandé si c’était bien. Au final, j’ai trouvé cela génial : mêmes applis sur les deux périphériques, au moins on ne cherche pas ses applications!

La tablette a ensuite été chercher ses mises à jours pour Android : d’abord la 4.1.2 (23 Mo) puis, un reboot plus tard, la 4.2.1 (85 Mo). Et hop, la tablette est entièrement mise à jour, avec toutes mes applications en quelques minutes.

Lire la suite

HTML5 : corriger l'erreur "The frameborder attribute on the iframe element is obsolete. Use CSS instead." photo

HTML5 : résoudre l’erreur “keyword publisher is not registered” (validateur W3C)

HTML5 logo

Sur votre site ou blog, vous avez peut-être ajouté le widget ou bouton +1 de Google+, le réseau social de Google. Or le petit problème, c’est que le code fourni empêche la bonne validation du document.

Voici le code fourni par Google :

<a title="Google+" href="https://plus.google.com/114535411372700844744" rel="publisher nofollow">Google+</a>Code language: HTML, XML (xml)

et voici l’erreur renvoyée par le validateur W3C :

Keyword publisher is not registered

HTML5 étant toujours en cours de réalisation, les valeurs de la balise rel sont assez restreintes et on ne peut pas mettre tout ce que l’on veut sans déclencher l’erreur.

La solution est toute simple : il faut ajouter la valeur du rel en argument dans le lien, comme ceci :

<a title="Google+" href="https://plus.google.com/114535411372700844744?rel=publisher" rel="nofollow">Google+</a>Code language: HTML, XML (xml)

Et voilà, plus d’erreur lors de la validation.

google-v-microsoft-v-apple

Google vs Microsoft vs Apple : state of mind

Parce qu’au fond, vous savez bien qu’entre Google, Microsoft et Apple, tout est histoires d’interopérabilité ou de systèmes propriétaires, d’API ouvertes ou non, et de logiques mercantiles plus ou moins avouées :

google v microsoft v apple

RIP Steve Jobs.

Serveur dédié : analyse des performances du serveur photo

Serveur dédié : analyse des performances du serveur

Cela fait quelques mois que le nouveau serveur est en place et il est temps de faire un petit bilan au niveau des performances.

Charge processeur

Tout d’abord, bien que le serveur soit équipé des mêmes caractéristiques techniques (même CPU, même quantité de RAM), il s’avère qu’il est beaucoup plus réactif que l’ancien.

Le processeur n’est plus surchargé en permanence et lorsque l’on lance un top, la charge du processeur est le plus souvent entre 0.05 et 0.20, ce qui est idéal.

A titre de comparaison, l’ancien serveur avait une charge souvent supérieure à 2.

Analyse du temps de chargement des pages via Google Webmaster Tools

Il y a quelques semaines, je me suis connecté sur Google Webmaster Tools et lorsque j’ai atteint le graphique du temps de chargement des pages du site, j’ai eu l’agréable surprise de découvrir ceci :

serveur dedie response time 2011

Lire la suite

Éviter le contenu dupliqué en spécifiant l'URL canonique photo

Éviter le contenu dupliqué avec l’URL canonique

Google, Yahoo! et Live Search viennent de se mettre d’accord pour essayer de résoudre les problèmes de contenus dupliqués à l’intérieur d’un site : ils ont opté pour la création d’une balise spéciale qui décrit l’URL canonique d’une page (c’est-à-dire son URL officielle) :

rel="canonical"Code language: JavaScript (javascript)

Le problème : le contenu dupliqué

Ce qui pose problème pour les moteurs de recherche, c’est savoir quelle est la bonne page à indexer lorsqu’un même contenu est disponible à plusieurs adresses différentes.

C’est le problème du contenu dupliqué, ou duplicate content.

duplicate content

C’est mauvais pour le référencement d’un site car pour les moteurs de recherche, une page web ou tout autre document indexable (comme les fichiers PDF, DOC, XLS…) équivaut à une URL.

Cette URL doit être unique pour le robot, pour qui une autre URL correspond à une autre page.

Si ce n’est pas le cas, ces pages dupliquées entrent en concurrence les unes avec les autres dans les résultats de recherche, ce qui n’est pas bon.

Lire la suite

Migration des flux FeedBurner vers les comptes Google photo

Migration des flux FeedBurner vers les comptes Google

Migration de feedburner vers google

Cela fait quasiment deux ans que Google a racheté FeedBurner et pas grand-chose ne s’était passé depuis.

Et bien la machine vient de se mettre en marche : la grande migration des comptes FeedBurner vers les comptes Google a déjà commencé.

Cette migration, qui concerne tous les comptes, se terminera le 28 février donc je vous conseille de prendre les devants et de migrer votre compte vous-même.

La migration prend moins de 2 minutes.

Lire la suite

Supprimer la publicité des recherches Google

Google Marre de la publicité qui s’affiche en haut et à droite des résultats de vos recherches avec Google ? N’en jetez plus ! Voici une petite astuce pour l’éliminer purement et simplement : pas de hack, pas de script, il suffit d’aller sur Google avec l’URL suivante :

http://www.google.fr/search?output=googleabout

Rajoutez la variable output=googleabout et la publicité disparaît comme par enchantement, laissant la place à une page des résultats épurée et donc au final plus rapide, sans fioritures. Nickel !

Compte Google AdSense désactivé : l’arnaque par Google

J’ai reçu ce message de la part de Google ce matin :

Google Adsense : la belle arnaque !

Bonjour Matt,

Nous avons constaté que des clics incorrects ont été générés à partir des annonces Google diffusées sur votre site. Nous avons par conséquent désactivé votre compte Google AdSense. Cette mesure a été prise dans le but de protéger les intérêts des annonceurs AdWords.

Le site d’un éditeur ne doit pas générer de clics incorrects sur des annonces, incluant, sans s’y limiter, les clics générés par :

– un éditeur cliquant sur ses propres pages Web
– un éditeur incitant d’autres utilisateurs à cliquer sur ses annonces
– des outils automatisés de génération de clics ou tout autre logiciel de détournement de clics.
– un éditeur modifiant toute portion du code d’annonce ou l’apparence, le fonctionnement, le ciblage ou la diffusion des annonces pour quelque raison que ce soit

Ces pratiques constituent une violation des Conditions générales et du règlement du programme Google AdSense, que vous pouvez consulter sur les pages suivantes :

https://www.google.com/adsense/localized-terms?hl=fr
https://support.google.com/adsense/answer/48182?utm_source=aso&utm_medium=link&utm_campaign=ww-ww-et-asfe_&hl=fr&gsessionid=gSlW8RrVfqaKHi2zsgCJVA

Les éditeurs dont les comptes ont été désactivés en raison de clics incorrects, ne sont plus autorisés à participer au programme AdSense et ne recevront plus aucun nouveau paiement. Les gains de votre compte seront remboursés de manière appropriée aux annonceurs victimes de ces clics incorrects.

Cordialement,

L’équipe Google AdSense

Le problème, c’est que les pubs affichés sur le site, je ne les vois pas parce que j’utilise l’extension AdBlock Plus pour Firefox. Donc comment pourrais-je cliquer sur une annonce qui ne s’affiche pas chez moi ?!?

Je n’utilise bien évidemment pas de programmes litigieux et n’ai incité personne à cliquer sur leurs annonces. Voilà, donc Adsense se termine ici apparemment.

J’ai contacté leur support par email et par téléphone – qui renvoie vers le formulaire par mail d’ailleurs, toujours agréable lorsque l’on a besoin de parler à quelqu’un – mais je ne m’attends manifestement pas à un renversement de situation, vu ce que j’ai pu lire çà et là sur quelques forums.

Après enquête, il s’avère qu’il importe peu qui a cliqué sur les bannières : que ce soit un webmaster peu scrupuleux ou un petit malin qui s’amuse, le compte est désactivé.

Par extrapolation : cliquez à répétition sur les annonces Google d’un site et celui-ci perdra son compte Adsense. Une logique imparable – c’est le webmaster qui en fait les frais. Adsense DTC, by Google…