Prise en compte ou non des commentaires html <!- -->

WRInaute accro
J'ai je pense un cas intéressant à soumettre.

J'ai soumis il y a quelques mois un site web réalisé par un ami. Il a fallu deux semaines au site pour apparaître sur Yahoo, Msn, et les principaux moteurs, TOUS sauf Google, où le site restait invisible.

Lors d'une enième tentative de compéhension du problème, j'ai trouvé ça, commenté en en-tête de la page d'index :

<!-- <base href="C:\Program Files\EasyPhp\www\site\index.php">-->

Un bête bashref commenté donc.

Or je croyais avoir lu que le contenu des commentaires html n'était pas pris en compte par Google.

Seulement après retrait de ce commentaire et de son contenu, le site a été très vite pris en compte sur Google, preuve que d'une certaine façon le contenu des commentaires HTML n'est pas ignoré par le moteur.

J'aimerais avoir vos avis là-dessus.

PS: si ce n'est pas le bon forum, j'espère qu'un modo voudra bien déplacer ce message.
 
WRInaute impliqué
Il semblerai que si dans les premiers octets d'une page soit que du vide (deux trois lignes de vides) Google n'indexe pas ces pages..... et vu que Google ne prend pas en compte des commentaires, il se peut qu'il ait considéré que ces lignes de commentaires soient du vide......

Cependant je n'ai aucun preuve ou quelque source sur quoi m'appuyer pour démontrer cela, juste une conclusion personnelle....

Donc à tester!
 
WRInaute accro
En fait...

J'ai essayé de remettre l'ancienne page après avoir résolu le problème. En la testant avec un dead link checker (celui d'oxymoron ce me semble), toutes les url de la page prenaient en compte le basehref lors du test, même si celui-ci était commenté.

Alors ok, oxymoron ce n'est pas google, mais bon...
 
WRInaute discret
tu héberge ton site chez toi?

parceque si non, ta base href ne sert strictement à rien, si ce n'est relativiser tous les liens, images, css, etc... par rapport à index.php qui se trouve à la racine (donc ta base par default)!


justement google doit ignorer le commentaire dans l'entête et du coup tous tes liens on pour base "easyphp/...."


Il semblerai que si dans les premiers octets d'une page soit que du vide (deux trois lignes de vides) Google n'indexe pas ces pages..... et vu que Google ne prend pas en compte des commentaires, il se peut qu'il ait considéré que ces lignes de commentaires soient du vide......

Cependant je n'ai aucun preuve ou quelque source sur quoi m'appuyer pour démontrer cela, juste une conclusion personnelle....

Donc à tester!

j'avais remarqué un blem identique : j 'avais une 10n de lignes vides avant l'entête d'une page d'accueil, ce site ne s'indexait pas correctement (je ne sais toujours pas si c'est à cause de cela...), et après un vulgaire format code source + cleanup dreamweaver le site a commencé a s'indexer... peut etre une simple coincidence
 
Discussions similaires
Haut