Ne pas indexer les PDF

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Ne pas indexer les PDF

Message le Ven Oct 12, 2007 8:39

Bonjour, je dispose d'un ptit site en Joomla...
Celui-ci a un ptit contenu correct, et comme la plupart des sites joomla, il propose (enfin j'ai laissé l'option) l'article au format PDF...

J'aimerais ne pas indexer par Google ce PDF, j'ai quelques articles indexé dans mes premiers résultat qui ne sortent que en pdf (avec la traduc en html par GG qui est pire) alors que la page est dispo en html directement...

Quelqu'un as-til une solution simple ?
Si possible sans .htaccess plutôt par robots.txt ou par cfg d'apache...


raljx
WRInaute accro
WRInaute accro
 
Messages: 2233
Inscription: Lun Juil 10, 2006 16:46

Message le Ven Oct 12, 2007 8:57

Dans ton robots.txt :

Code: Tout sélectionner
User-agent: *
Disallow: /*.pdf$


ou seulement pour GG

Code: Tout sélectionner
User-agent: Googlebot
Disallow: /*.html$


phpmikedu83
WRInaute accro
WRInaute accro
 
Messages: 1281
Inscription: Sam Aoû 06, 2005 7:34

Message le Ven Oct 12, 2007 9:01

La meilleur solution serait une redirection 301 de tes pdf vers tes fichiers .html

Après, il faut connaître la convention de nommage des 2 types de fichier pour te proposer une règle à mettre dans le httpd.conf
Et savoir aussi, si tu ne veux plus laisser l'accès aux formats pdf ;-)


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Message le Ven Oct 12, 2007 9:04

Alors j'ai trouvé ce post (merci dd)
http://www.webrankinfo.com/forums/viewtopic_29906.htm
Mais je viens de tester cela n'a pas l'air de marcher, mes pdf ont une tête bizarre :p
Code: Tout sélectionner
/index2.php?option=com_content&do_pdf=1&id=100

Donc d'après l'article, j'ai testé, cela n'a pas l'air de marcher en mettant un ;

Disallow: /index2.php?option=com_content&do_pdf=


dmathieu
Modérateur
Modérateur
 
Messages: 6924
Inscription: Ven Jan 09, 2004 16:21

Message le Ven Oct 12, 2007 9:35

Le disallow que tu viens de donner devrait fonctionner.
Attention cependant, Google est toujours un peu long pour remettre à jour le contenu d'un robots.txt.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Message le Ven Oct 12, 2007 9:42

Ah j'me disais aussi, ça pouvais venir de ça...
Bon, je laisse ça comme ça alors, on va bien voir :p
Merci pour vos infos, on va tester...


dmathieu
Modérateur
Modérateur
 
Messages: 6924
Inscription: Ven Jan 09, 2004 16:21

Message le Ven Oct 12, 2007 9:44

Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant.


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Message le Ven Oct 12, 2007 9:54

Bah j'pensais qu'au moment des tests, plutôt que de se servir de son fichier en cache, il retentait en temps réel vu que c'est un "Outils pour les Webmasters" :P


david96
WRInaute accro
WRInaute accro
 
Messages: 1407
Inscription: Dim Aoû 28, 2005 21:56

Message le Sam Oct 13, 2007 6:52

kazhar a écrit:Euh ouais, faut pas croire les idées reçues. Google n'est pas Dieu et il ne peut détecter automatiquement ton nouveau robots.txt. Il faut qu'il le crawle avant.

Pourtant il le fait pour les actualités ! :D


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Message le Sam Oct 13, 2007 6:59

It'S WorK !


david96
WRInaute accro
WRInaute accro
 
Messages: 1407
Inscription: Dim Aoû 28, 2005 21:56

Message le Sam Oct 13, 2007 7:40

Gné, heingue, comment, allo !? :roll: :lol:


dmathieu
Modérateur
Modérateur
 
Messages: 6924
Inscription: Ven Jan 09, 2004 16:21

Message le Sam Oct 13, 2007 10:45

Julia41 a écrit:It'S WorK !


Sauf que c'est incorrect ça. C'est "It works" ou "It's working" ;)


Julia41
WRInaute impliqué
WRInaute impliqué
 
Messages: 446
Inscription: Ven Aoû 31, 2007 21:17

Message le Sam Oct 13, 2007 10:53

Hum merde pour une fois qu'tu fais gaffe à pas faire de fautes d'orthographes dans ton message...
Hum la prochaine fois, attention à toi...
Et de toute façon tout le monde avait compris :p


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Willgoto et 0 invités