Mauvais crawl de Google

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics

alainp
WRInaute discret
WRInaute discret
 
Messages: 148
Inscription: 13 Juin 2003

Mauvais crawl de Google

Message le Mer Sep 07, 2011 12:56

Bonjour,
Google est en train de crawler mon site et plus particulièrement le forum qui tourne sous Connectix Board.

Jusqu'à présent cela ce passait bien mais aujourd'hui, toutes les pages qu'il prend se retrouvent en erreur 404 du fait que les adresses crawlées sont sous la forme h**p://www.mon site.net/forums/forum-t3371-p1

alors qu'elles sont en réalité sous la forme h**p://www.mon site.net/forums/forum-t3371-p1,titre-de-l-article.html

Aucune modif apportée à mon formum
Avez-vous une idée ou une solution pour empêcher çà
Merci par avance


Marie-Aude
Modérateur
Modérateur
 
Messages: 11887
Inscription: 5 Juin 2006

Re: Mauvais crawl de Google

Message le Mer Sep 07, 2011 13:27

Changer le séparateur en faisant une règle de réécriture ?

alainp
WRInaute discret
WRInaute discret
 
Messages: 148
Inscription: 13 Juin 2003

Re: Mauvais crawl de Google

Message le Mer Sep 07, 2011 15:58

Merci Marie-Aude mais je n'ai pas trop envie de modifier les adresses de tous les messages du forum.

Par contre, je crois que j'ai trouvé l'origine du problème.
Hier j'ai modifié le htaccess se trouvant à la racine du site (et non dans le sous répertoire du forum) pour y inclure des règles de cache, de compression, etc...

Je viens de retirer ces règles et après avoir consulté un certain nombre de messages de mon forum, je vois que Google repasse dessus avec les bonnes URL

Il semble donc que cela provienne de cette optimisation du htaccess. Je ne suis pas très doué sur ce sujet et je mets le code. Si quelqu'un peut me dire ce qui provoque la coupure de mes url de topics, j'en sera ravi.

Code: Tout sélectionner
# MOD_DEFLATE COMPRESSION
SetOutputFilter DEFLATE
AddOutputFilterByType DEFLATE text/html text/css text/plain text/xml application/x-javascript application/x-httpd-php
#Pour les navigateurs incompatibles
BrowserMatch ^Mozilla/4 gzip-only-text/html
BrowserMatch ^Mozilla/4\.0[678] no-gzip
BrowserMatch \bMSIE !no-gzip !gzip-only-text/html
BrowserMatch \bMSI[E] !no-gzip !gzip-only-text/html
#ne pas mettre en cache si ces fichiers le sont déjà
SetEnvIfNoCase Request_URI \.(?:gif|jpe?g|png)$ no-gzip
#les proxies doivent donner le bon contenu
Header append Vary User-Agent env=!dont-vary

# BEGIN Expire headers
<IfModule mod_expires.c>
ExpiresActive On
ExpiresDefault "access plus 7200 seconds"
ExpiresByType image/jpg "access plus 2592000 seconds"
ExpiresByType image/jpeg "access plus 2592000 seconds"
ExpiresByType image/png "access plus 2592000 seconds"
ExpiresByType image/gif "access plus 2592000 seconds"
AddType image/x-icon .ico
ExpiresByType image/ico "access plus 2592000 seconds"
ExpiresByType image/icon "access plus 2592000 seconds"
ExpiresByType image/x-icon "access plus 2592000 seconds"
ExpiresByType text/css "access plus 2592000 seconds"
ExpiresByType text/javascript "access plus 2592000 seconds"
ExpiresByType text/html "access plus 7200 seconds"
ExpiresByType application/xhtml+xml "access plus 7200 seconds"
ExpiresByType application/javascript A259200
ExpiresByType application/x-javascript "access plus 2592000 seconds"
ExpiresByType application/x-shockwave-flash "access plus 2592000 seconds"
</IfModule>
# END Expire headers

# BEGIN Cache-Control Headers
<IfModule mod_headers.c>
<FilesMatch "\\.(ico|jpe?g|png|gif|swf|gz|ttf)$">
Header set Cache-Control "max-age=2592000, public"
</FilesMatch>
<FilesMatch "\\.(css)$">
Header set Cache-Control "max-age=2592000, public"
</FilesMatch>
<FilesMatch "\\.(js)$">
Header set Cache-Control "max-age=2592000, private"
</FilesMatch>
<filesMatch "\\.(html|htm)$">
Header set Cache-Control "max-age=7200, public"
</filesMatch>
# Disable caching for scripts and other dynamic files
<FilesMatch "\.(pl|php|cgi|spl|scgi|fcgi)$">
Header unset Cache-Control
</FilesMatch>
</IfModule>
# END Cache-Control Headers

# KILL THEM ETAGS
Header unset ETag
FileETag none


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités