Duplicata content : "Google, indexe moins, steuplé"

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


twin
WRInaute accro
WRInaute accro
 
Messages: 1295
Inscription: Lun Fév 23, 2004 13:18

Duplicata content : "Google, indexe moins, steuplé"

Message le Jeu Oct 23, 2008 14:01

Hello à tous,

Je rencontre un problème avec mon site. Mes articles sont dispos avec 3 url différentes.

- Url que je souhaite continuer d'indexer :
*www.toilef1.com/mon-jolie-titre.html

- Url que je souhaite supprimer de gg (ex. article 5) :
*www.toilef1.com/article.php3?id_article=5 (utiliser par google actu)
*www.toilef1.com/spip.php?page=article-imprim&id_article=5

J'ai intégré un robot.txt à la racine, mais celui-ci ne fonctionne pas. :
Code: Tout sélectionner
User-agent:*
Disallow:/spip.php?page=article-imprim


Ma question est de savoir comment faire pour indiquer à google qu'il n'indexe plus mes 3 urls, mais seulement la première ?
Autre question, si je bloque l'url utilisé par google actu - est-ce que le bot de GGActu pourra toujours se connecter ?

Merki d'avance :)


HawkEye
Modérateur
Modérateur
 
Messages: 15041
Inscription: Lun Fév 23, 2004 12:33

Message le Jeu Oct 23, 2008 14:11

Un p'tit bout de php pour aller chercher le 'mon_joli_titre' qui correspond à $_GET['id_article'], un petit contrôle d'URI, et si l'URI ne correspond pas à ce qu'il devrait être ('mon-joli-titre.html'), redirection 301 vers cet URI.


twin
WRInaute accro
WRInaute accro
 
Messages: 1295
Inscription: Lun Fév 23, 2004 13:18

Message le Jeu Oct 23, 2008 14:42

Tu me croit si je te dis que je n'ai strictement rien compris ? :mrgreen:

Plus sérieusement, est-ce que tu aurait un bout de code que j'adapte à mon site ? Car là, je ne comprend pas tout... :?

hsii04
Nouveau WRInaute
 
Messages: 29
Inscription: Mar Mar 15, 2005 11:53

Message le Jeu Oct 23, 2008 15:59

Code: Tout sélectionner
if('/mon-url-reecrite.html' != $_SERVER['REQUEST_URI'])
{
dbClose();
header('HTTP/1.1 301 Moved Permanently');
header('Location: '.HTTP_HOST.'/mon-url-reecrite.html');
exit();
}


Ceci doit être correct


French Dread
WRInaute accro
WRInaute accro
 
Messages: 1990
Inscription: Mer Mai 07, 2003 10:04

Message le Jeu Oct 23, 2008 16:33

Si tu veux gérer ça via ton robots.txt :

Code: Tout sélectionner
User-agent: Googlebot
Disallow: /article.php3?id_article=*
Disallow: /spip.php?page=article-imprim&id_article=*


Par contre je sais plus si les autre smoteurs acceptent les wildcards. Google oui en tout cas. Sinon si tu spécifie les URLs à garder dans ton sitemap XML, Google devrait se débrouiller pour conserver celles-là et ignorer les mauvaises.


twin
WRInaute accro
WRInaute accro
 
Messages: 1295
Inscription: Lun Fév 23, 2004 13:18

Message le Jeu Oct 23, 2008 17:18

C'est parfait. Merci pour vos réponses.

doss
WRInaute discret
WRInaute discret
 
Messages: 68
Inscription: Mer Juin 04, 2008 22:26

Message le Jeu Oct 23, 2008 21:11

J'ai une p'ti question a ce sujet, la solution du 301 n'est t'elle pas meilleur niveau referencement ? car on conserve tout les backlinks


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5327
Inscription: Lun Juin 13, 2005 14:13

Message le Ven Oct 24, 2008 11:09

doss a écrit:J'ai une p'ti question a ce sujet, la solution du 301 n'est t'elle pas meilleur niveau referencement ? car on conserve tout les backlinks

Si, bien sur, la redirection 301 est la bonne solution d'une part pour les backlinks, mais également pour le transfert du "référencement acquis" éventuel des autres formes d'URL.
Les bloquer par un robots.txt ferait perdre cet acquis.


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Déterminer l'âge d'un site
    Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org).


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités