Indexation (pages ET images) qui bug complètement sur Google
10 messages
• Page 1 sur 1
Consultez la formation Google Maps, News, Images de WebRankInfo / Ranking Metrics
- Clement B
- Nouveau WRInaute

- Messages: 19
- Inscription: 2 Fév 2009
Indexation (pages ET images) qui bug complètement sur Google
Bonjour à tous,
J'ai lancé il y a 2 semaines un site Internet (interdit aux -18 ans, donc je tairai l'adresse en public) qui fait face à deux gros problèmes farfelus d'indexation
1. J'ai une 30ène d'images par page, renommées, avec un texte alternatif pour chacune, et sous-titrées d'une description en rapport. Voici le code HTML :
Le problème est que Google Image ignore l'attribut alt, ainsi que la description la plus proche/logique dans le code HTML,pour utiliser systématiquement la description de l'image suivante ! L'indexation ne date que d'hier et il n'y a qu'une dizaine d'images, mais j'ai « peur » que ça ne change pas avec le temps ?
2. Le second problème, moins important, est très farfelu. Suivez-bien !
En septembre 2008 je lance monsite.FR avec pour argument « ?page= » pour consulter les pages suivantes d'une catégorie; jamais aucun lien extérieur n'aura pointé sur ce type de page avec argument.
En mars 2009 je retire entièrement mon site des SERP via Google Webmaster, puis fait rediriger le .FR vers le .COM pour ceux qui se tromperaient de TLD à l'avenir.
Début avril 2009, je lance le site sur le .COM, mais l'argument « ?page= » pour consulter une page suivante est rewrité pour être de la forme « monsite.com/2 » quand on veut consulter la page 2 par exemple.
Le problème est que Google se débrouille pour m'indexer des adresses du nouveau site dans l'ancien format « monsite.COM/?page= » !
Les règles de mon htaccess sont bonnes, aucun lien buggé ne pointe vers « monsite.COM?page= » si ce n'étaient les anciennes pages (pourtant retirées des SERPS en mars 2009) du .FR qui pointent vers le .COM ! Voici ma façon de résoudre le problème :
J'en conclu que Google continu de suivre des pages (sans backlink, donc uniquement en mémoire) que je lui ai demandé de retirer. Qu'en pensez-vous ? Quand aux images aux descriptions qu'ils décalent, qu'en pensez-vous ?
Merci par avance de m'avoir lu entièrement
J'ai lancé il y a 2 semaines un site Internet (interdit aux -18 ans, donc je tairai l'adresse en public) qui fait face à deux gros problèmes farfelus d'indexation
1. J'ai une 30ène d'images par page, renommées, avec un texte alternatif pour chacune, et sous-titrées d'une description en rapport. Voici le code HTML :
- Code: Tout sélectionner
<span class="image">
<a href="/page-1/" target="_blank">
<img src="/page-1/bla-bla-truc.jpg" alt="Bla bla et truc" />
<span class="description">Du texte au tour de bla bla et compagnie</span>
</a>
</span>
Le problème est que Google Image ignore l'attribut alt, ainsi que la description la plus proche/logique dans le code HTML,pour utiliser systématiquement la description de l'image suivante ! L'indexation ne date que d'hier et il n'y a qu'une dizaine d'images, mais j'ai « peur » que ça ne change pas avec le temps ?
2. Le second problème, moins important, est très farfelu. Suivez-bien !
En septembre 2008 je lance monsite.FR avec pour argument « ?page= » pour consulter les pages suivantes d'une catégorie; jamais aucun lien extérieur n'aura pointé sur ce type de page avec argument.
En mars 2009 je retire entièrement mon site des SERP via Google Webmaster, puis fait rediriger le .FR vers le .COM pour ceux qui se tromperaient de TLD à l'avenir.
Début avril 2009, je lance le site sur le .COM, mais l'argument « ?page= » pour consulter une page suivante est rewrité pour être de la forme « monsite.com/2 » quand on veut consulter la page 2 par exemple.
Le problème est que Google se débrouille pour m'indexer des adresses du nouveau site dans l'ancien format « monsite.COM/?page= » !
Les règles de mon htaccess sont bonnes, aucun lien buggé ne pointe vers « monsite.COM?page= » si ce n'étaient les anciennes pages (pourtant retirées des SERPS en mars 2009) du .FR qui pointent vers le .COM ! Voici ma façon de résoudre le problème :
- Code: Tout sélectionner
RewriteCond %{HTTP_HOST} ^(www.)?monsite.fr
RewriteRule .* http://monsite.com/? [L,R=301] # avec le ? pour retirer tout argument lors de la redirection
# règle de réécriture « inversée »
RewriteCond %{QUERY_STRING} ^page=([0-9]+)$
RewriteRule (.*) $1%1? [R=301]
RewriteRule ^([0-9]+)$ /?numeroDePage=$1 # utilisé à la place de ?page= pour éviter une boucle infinie
J'en conclu que Google continu de suivre des pages (sans backlink, donc uniquement en mémoire) que je lui ai demandé de retirer. Qu'en pensez-vous ? Quand aux images aux descriptions qu'ils décalent, qu'en pensez-vous ?
Merci par avance de m'avoir lu entièrement
- Clement B
- Nouveau WRInaute

- Messages: 19
- Inscription: 2 Fév 2009
Re: Indexation (pages ET images) qui bug complètement sur Google
Bonjour à tous,
Le problème numéro 2 est en train de se résoudre, j'espère que ma contribution pourra en aider d'autres, voire intriguer
Pour le problème numéro 1, je pense ne pas avoir été clair, donc j'ai reproduit une page propre (code HTML/CSS valide, et facile à comprendre) qui rend comme ceci :

ainsi que la page de résultat de Google Image :

Je pense que le problème est ici bien plus flagrant : lisez les commentaires sous mes images, et celles de Google, c'est décalé !
En vous remerkiant
Le problème numéro 2 est en train de se résoudre, j'espère que ma contribution pourra en aider d'autres, voire intriguer
Pour le problème numéro 1, je pense ne pas avoir été clair, donc j'ai reproduit une page propre (code HTML/CSS valide, et facile à comprendre) qui rend comme ceci :

ainsi que la page de résultat de Google Image :

Je pense que le problème est ici bien plus flagrant : lisez les commentaires sous mes images, et celles de Google, c'est décalé !
En vous remerkiant
-

cedric_g - WRInaute accro

- Messages: 3552
- Inscription: 18 Jan 2006
Re: Indexation (pages ET images) qui bug complètement sur Google
Bonjour
Ton problème de libellé est assez étrange, à croire que les balises SPAN ne sont pas forcément "comprises" convenablement par Google... En soi c'est surprenant mais c'est aussi (peut-être) logique quelque part, car les balises SPAN sont des balises INLINE qui ne sont pas destinées à avoir un rôle "sémantique" au niveau de la hiérarchie des informations dans la page (c'est en tout cas l'interprétation et l'utilisation que j'en fait personnellement).
Dans ton cas tu aurais tout à gagner à afficher tes images avec des listes (UL / LI) ce qui serait plus "juste" sémantiquement parlant (je parle de sémantique au niveau du code et de la structure de la page). Et il n'y aurait aucune ambiguïté sur la distribution des textes par rapport aux images
Dans ton cas, pour moi le schéma serait donc le suivant :
J'aime bien "entourer" mes galeries dans une DIV, c'est plus propre (je trouve) au niveau sémantique du code, et plus facilement manipulable au niveau des CSS...
On peut imaginer d'autres variantes selon les besoins, mais pour moi la règle des listes est immuable. Que ce soient des images ou du texte
Ton problème de libellé est assez étrange, à croire que les balises SPAN ne sont pas forcément "comprises" convenablement par Google... En soi c'est surprenant mais c'est aussi (peut-être) logique quelque part, car les balises SPAN sont des balises INLINE qui ne sont pas destinées à avoir un rôle "sémantique" au niveau de la hiérarchie des informations dans la page (c'est en tout cas l'interprétation et l'utilisation que j'en fait personnellement).
Dans ton cas tu aurais tout à gagner à afficher tes images avec des listes (UL / LI) ce qui serait plus "juste" sémantiquement parlant (je parle de sémantique au niveau du code et de la structure de la page). Et il n'y aurait aucune ambiguïté sur la distribution des textes par rapport aux images
Dans ton cas, pour moi le schéma serait donc le suivant :
- Code: Tout sélectionner
<div class="galerie-images">
<ul>
<li>
<a ...>
<img ... alt="titre de l'image 1" />
<span>Description de l'image 1</span>
</a>
</li>
<li>
<a ...>
<img ... alt="titre de l'image 2" />
<span>Description de l'image 2</span>
</a>
</li>
...
</ul>
</div>
J'aime bien "entourer" mes galeries dans une DIV, c'est plus propre (je trouve) au niveau sémantique du code, et plus facilement manipulable au niveau des CSS...
On peut imaginer d'autres variantes selon les besoins, mais pour moi la règle des listes est immuable. Que ce soient des images ou du texte
- Clement B
- Nouveau WRInaute

- Messages: 19
- Inscription: 2 Fév 2009
Re: Indexation (pages ET images) qui bug complètement sur Google
Bien bien bien, entre temps j'ai aussi déplacé mes images (avec 301) dans un sous-répertoire, en plus d'utiliser les <li>. Toutes mes images sont sorties de l'index Google Images, et celles qui y rentrent de nouveau ont la bonne description !
Merci cedric_g !
Merci cedric_g !
10 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Maps, Google News et Google Images : apprenez comment optimiser le référencement de votre site pour la recherche universelle et notamment Google Maps, Google Actualités et Google Images. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Indexation des images dans Google Images
- Indexation Google images
- Indexation des images via Google news
- Indexation et affichage dans Google Images
- Indexation dans google images aujourd'hui
- indexation des images sur google
- Indexation de mes dossiers images par google.
- Bug affichage images IE 6.0
- indexation images
- Revenir à une indexation et positionnement avant l'arrivée d'un bug.
- Tester l'indexation récente d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Trouver les sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

