Forcer GG à indexer une page html plutôt qu'un PDF
13 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

titifrim - WRInaute occasionnel

- Messages: 285
- Inscription: 21 Mar 2006
Forcer GG à indexer une page html plutôt qu'un PDF
J'aimerais savoir s'il existe un moyen de forcer notre ami google à référencer une page html qui a son équivalence en PDF ? A ce jour seul le fichier PDF est dispo dans les SERP... 
- amri-referencement
- WRInaute impliqué

- Messages: 505
- Inscription: 4 Jan 2007
Re: Forcer GG à indexer une page html plutôt qu'un PDF
titifrim a écrit:J'aimerais savoir s'il existe un moyen de forcer notre ami google à référencer une page html qui a son équivalence en PDF ? A ce jour seul le fichier PDF est dispo dans les SERP...
Bonjour,
Perso, j'inclurai cette page HTML dans mon sitemap.xml, afin de me donner toutes les chances à GG de l'indéxer. En sachant que le sitemap n'est qu'un outil d'aide à l'indéxation.
Tu ne pourras en aucun forcer GG à indéxer cette page, mais plutôt l'aider à l'indéxer.
A part cela, je ne vois pas d'autres solutions. En tous cas ta question, me fais à mon tour me poser une question.
J'aimerais savoir si à votre avis, un PDF déjà indéxé dans Google, qui serait repris de manière identique dans une page HTML, n'est pas un contenu dupliqué ?
Car à la final GG détiendrai 2 fois la même information, mais pas sous la même forme .... Je me trompe ...
En espérant avoir pu t'aider.
Fanny AMRI
-

HawkEye - WRInaute accro

- Messages: 17013
- Inscription: 23 Fév 2004
- Code: Tout sélectionner
<a href="page.html" onclick="javascript:document.location('/pdf/page.pdf');return false;">ancre</a>
+ un robots.txt qui interdit l'indexation du répertoire /pdf/
Ca irait ?
-

titifrim - WRInaute occasionnel

- Messages: 285
- Inscription: 21 Mar 2006
HawkEye a écrit:
- Code: Tout sélectionner
<a href="page.html" onclick="javascript:document.location('/pdf/page.pdf');return false;">ancre</a>
+ un robots.txt qui interdit l'indexation du répertoire /pdf/
Ca irait ?
Je m'en vais de suite tester ça merci HawkEye
-

Aye-Aye - WRInaute passionné

- Messages: 1917
- Inscription: 15 Avr 2005
- Code: Tout sélectionner
User-agent: Googlebot
Disallow: /*.pdf$
-

titifrim - WRInaute occasionnel

- Messages: 285
- Inscription: 21 Mar 2006
Aye-Aye a écrit::arrow: Pour supprimer tous les fichiers d'un type en particulier (.pdf, par exemple), utilisez l'entrée robots.txt suivante :
- Code: Tout sélectionner
User-agent: Googlebot
Disallow: /*.pdf$
Ah oui ? je ne savais pas qu'une telle commande existait, je pensais qu'on pouvais exclure les répertoires ou bien se taper chaque fichier ligne par ligne...
- bertrand3w
- Nouveau WRInaute

- Messages: 14
- Inscription: 29 Oct 2007
Meilleure indexation des documents PDF
Bonjour,
je rencontre le même phénomène que titifrim. Pour chaque fiche produit html, nous proposons aux visiteurs de l'enregistrer en PDF (aui par ailleurs ne sont pas du tout optimisés pour le référencement). Or, j'ai remarqué que certains documents PDF sont mieux indexés que des fiches html identiques.
Est-ce que quelqu'un pourrait m'expliquer les raisons de ce phénomène? Google jugerait-il les documents PDF comme des sources d'information plus fiable?
Merci de bien vouloir de me faire part de votre expérience à ce sujet.
je rencontre le même phénomène que titifrim. Pour chaque fiche produit html, nous proposons aux visiteurs de l'enregistrer en PDF (aui par ailleurs ne sont pas du tout optimisés pour le référencement). Or, j'ai remarqué que certains documents PDF sont mieux indexés que des fiches html identiques.
Est-ce que quelqu'un pourrait m'expliquer les raisons de ce phénomène? Google jugerait-il les documents PDF comme des sources d'information plus fiable?
Merci de bien vouloir de me faire part de votre expérience à ce sujet.
- bertrand3w
- Nouveau WRInaute

- Messages: 14
- Inscription: 29 Oct 2007
Re: Meilleure indexation des documents PDF
bertrand3w a écrit:Bonjour,
je rencontre le même phénomène que titifrim. Pour chaque fiche produit html, nous proposons aux visiteurs de l'enregistrer en PDF (aui par ailleurs ne sont pas du tout optimisés pour le référencement). Or, j'ai remarqué que certains documents PDF sont mieux indexés que des fiches html identiques.
Est-ce que quelqu'un pourrait m'expliquer les raisons de ce phénomène? Google jugerait-il les documents PDF comme des sources d'information plus fiable?
Merci de bien vouloir de me faire part de votre expérience à ce sujet.
Quelqu'un aurait-il une idée sur la question? Merci d'avance.
-

WebRankInfo - Administrateur du site

- Messages: 19415
- Inscription: 19 Avr 2002
en tout cas je te déconseille de faire indexer les 2 versions (garde la HTML)...
- bertrand3w
- Nouveau WRInaute

- Messages: 14
- Inscription: 29 Oct 2007
WebRankInfo a écrit:en tout cas je te déconseille de faire indexer les 2 versions (garde la HTML)...
Merci pour ta réponse. D'après toi Google accorderait une plus grande importance aux documents PDF qu'aux docs html?
- Olivier C
- Nouveau WRInaute

- Messages: 1
- Inscription: 29 Sep 2010
Re: Forcer GG à indexer une page html plutôt qu'un PDF
Bonjour,
J'ai le même problème que vous : quand je propose un article ou un tableau en PDF, celui-ci se référence au dépend de la page HTML qui le contient.
Mais si Google lit - et référence - les PDF, il me semble qu'il ne sait pas lire les fichiers compressés (ZIP). Ma solution est donc simple : je propose la documentation PDF en fichier zipé.
Par contre la recherche ne se fait plus sur le contenu du PDF, ce qui peut être préjudiciable si celle-ci n'apparaît pas sur la page HTML.
Comme vos posts datent de 2008, si vous connaissez depuis des solutions alternatives, ça m'intéresse.
J'ai le même problème que vous : quand je propose un article ou un tableau en PDF, celui-ci se référence au dépend de la page HTML qui le contient.
Mais si Google lit - et référence - les PDF, il me semble qu'il ne sait pas lire les fichiers compressés (ZIP). Ma solution est donc simple : je propose la documentation PDF en fichier zipé.
Par contre la recherche ne se fait plus sur le contenu du PDF, ce qui peut être préjudiciable si celle-ci n'apparaît pas sur la page HTML.
Comme vos posts datent de 2008, si vous connaissez depuis des solutions alternatives, ça m'intéresse.
13 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Forcer le téléchargement d'un pdf
- Forcer le téléchargement d'un fichier PDF
- Faut-il indexer les pdf ?
- PDF : Forcer la lecture à partir d'une page html
- Ne pas indexer les PDF
- [Google] Technique OCR pour indexer les fichiers PDF
- Votre avis sur le moteur de recherche pdf : documentation-pdf.com
- Indexer une 2nd url d'un site deja indexer
- Référencement de fichiers pdf dont l'url n'est pas en pdf
- Lecture d'un PDF avec Zend PDF
Consultez la description détaillée des produits ou services de Google suivants : Google PDF Quick View
Qui est en ligne
Utilisateurs parcourant ce forum: salva, stephdim et 0 invités
