outils: recherche des 404 à partir de google

Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

outils: recherche des 404 à partir de google

Message le Mar Aoû 19, 2008 23:24

Bonjour à tous!
Voici ma petite contribution pour le forum

J'utilise un cms avec un module d'url rewriting
Donc en un clic on peut changer l'url de ses pages et se retrouver avec des 404 partout.
Je ne suis pas codeur mais j'ai réussi à me faire un script qui récupère la liste des pages indexées pour un site donné via la commande site de google.
Il détecte ensuite les 404.

Ce script ne marche pas pour les sites qui ont plus de 999 pages indexées et n'affiche pas plus que 600 résultats

Le résultat ne s'affiche que quand tout est fini donc c'est un peu long!
Peut être je pourrais rajouter de l'ajax?je ne sais pas.....

si vous voulez le tester ça marche plutôt bien pour les sites avec peu de pages indexées

->http://essai.zero-frais.com/check.php<-


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 3062
Inscription: Jeu Sep 14, 2006 4:53

Message le Mer Aoû 20, 2008 0:07

Au fait, On a accès aux page notées 404 dans les outils google webmasters !

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

Message le Mer Aoû 20, 2008 0:18

C'est trop tard pour moi je veux les connaître avant google!


spout
WRInaute accro
WRInaute accro
 
Messages: 1258
Inscription: Mer Mai 14, 2003 11:05

Message le Mer Aoû 20, 2008 5:43

pouloupoupo a écrit:qui récupère la liste des pages indexées pour un site donné via la commande site de google.
Il détecte ensuite les 404.


pouloupoupo a écrit:C'est trop tard pour moi je veux les connaître avant google!


Tu utilises quand même l'indexation de Google donc c'est pas avant...

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

Message le Mer Aoû 20, 2008 10:44

spout a écrit:
pouloupoupo a écrit:qui récupère la liste des pages indexées pour un site donné via la commande site de google.
Il détecte ensuite les 404.


pouloupoupo a écrit:C'est trop tard pour moi je veux les connaître avant google!


Tu utilises quand même l'indexation de Google donc c'est pas avant...


mais si!
Google indexe mes pages
Si je viens à changer une règle du module rewrinting de mon cms je ne sais pas quelles url peuvent avoir changer.
Je le découvre soit dans gwt et c'est pas bon ou soit dans les logs de mes visiteurs et c'est encore moins bon.

Mon script me permet d'anticiper


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15829
Inscription: Ven Avr 19, 2002 19:51

Message le Mer Aoû 20, 2008 10:58

pour faire encore mieux, il faut soit éviter de modifier tes URL, soit gérer des redirections 301 des anciennes vers les nouvelles

cela dit un détecteur de 404 est toujours bon à prendre. Sur un petit site mieux vaut utiliser Xenu je pense.

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

Message le Mer Aoû 20, 2008 11:31

Oui je suis d'accord avec toi j'évite le plus possible de modifier mes urls
Mail dans mon cas j'utilise un cms et quand je change le nom d'une catégorie ça me change mon url...
Xenu vérifie les liens d'un site? moi je vérifie les liens indexés par google ce qui est différent
car je trouve très pénalisant de tomber sur une 404 surtout au lancement d'un site

++


Suede
WRInaute accro
WRInaute accro
 
Messages: 3721
Inscription: Ven Oct 04, 2002 11:22

Message le Mer Aoû 20, 2008 11:37

pouloupoupo a écrit:Oui je suis d'accord avec toi j'évite le plus possible de modifier mes urls
Mail dans mon cas j'utilise un cms et quand je change le nom d'une catégorie ça me change mon url...
Xenu vérifie les liens d'un site? moi je vérifie les liens indexés par google ce qui est différent
car je trouve très pénalisant de tomber sur une 404 surtout au lancement d'un site

++


Tu ne peux pas gerer les noms des pages autrement que par le nom de la catégorie?
Par exemple nom-catégorie-c1234/ ? Après tu fais une verification que le nom de ta categorie est correcte sinon tu rediriges en 301. C'est un peu pres ce que permet de faire phpbb-seo pour phpbb


WebRankInfo
Administrateur du site
Administrateur du site
 
Messages: 15829
Inscription: Ven Avr 19, 2002 19:51

Message le Mer Aoû 20, 2008 11:38

comme on te l'a dit, si tu veux les détecter avant Google, il faut crawler ton site et non pas se baser sur l'indexation Google...

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

Message le Mer Aoû 20, 2008 12:43

Merci mais vous inquiétez pas pour moi :-)
ce tool est aussi un défi et j'aimerais avoir quelques retour sur son fonctionnement
Je n'ai pas trouvé de tel script et j'aimerais pourquoi pas l'améliorer

Merci ++

Fnnyaert
WRInaute discret
WRInaute discret
 
Messages: 61
Inscription: Mar Déc 25, 2007 22:37

Message le Mer Aoû 20, 2008 16:08

Confonds pas GWT et tes outils google pour webmasters
GWT est un framework écrit en JAVA pour développer ses pages internet
Ca n'a rien à voir

Sinon c'est sympa et pratique, on peut afficher seulement les erreurs ? ou de le faire à partir d'un sitemap ?


jeanluc
WRInaute accro
WRInaute accro
 
Messages: 2653
Inscription: Lun Mai 03, 2004 14:48

Message le Mer Aoû 20, 2008 16:33

pouloupoupo a écrit:Oui je suis d'accord avec toi j'évite le plus possible de modifier mes urls
Mail dans mon cas j'utilise un cms et quand je change le nom d'une catégorie ça me change mon url...
Je ne comprends pas ta méthode de travail. Tu fais quoi quand tu as détecté une URL qui est passée en 404 parce que tu as changé le rewriting ? Une redirection 301 ?

Ton CMS ne te permet-il pas de savoir quelles pages appartiennent à une catégorie donnée et donc, par conséquent, quelles URL vont changer quand tu changeras le nom de cette catégorie ?

Jean-Luc

pouloupoupo
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 133
Inscription: Dim Avr 13, 2008 21:57

Message le Mer Aoû 20, 2008 16:39

Fnnyaert a écrit:Confonds pas GWT et tes outils google pour webmasters
GWT est un framework écrit en JAVA pour développer ses pages internet
Ca n'a rien à voir

Sinon c'est sympa et pratique, on peut afficher seulement les erreurs ? ou de le faire à partir d'un sitemap ?


GWT = google webmaster tools :lol:

Je note tes remarques, pas con l'histoire du sitemap!

pouloupoupo a écrit:
Oui je suis d'accord avec toi j'évite le plus possible de modifier mes urls
Mail dans mon cas j'utilise un cms et quand je change le nom d'une catégorie ça me change mon url...
Je ne comprends pas ta méthode de travail. Tu fais quoi quand tu as détecté une URL qui est passée en 404 parce que tu as changé le rewriting ? Une redirection 301 ?

Ton CMS ne te permet-il pas de savoir quelles pages appartiennent à une catégorie donnée et donc, par conséquent, quelles URL vont changer quand tu changeras le nom de cette catégorie ?

Jean-Luc


Oui je fais une redirection 301 mais tu peut être vite dépassé si tu changes une règle comme "suppression des mots courts" ou changement de certains caractères comme l'espace devient un "-" et le "-" est supprimé....

Mon site en question est un annuaire et le titre des pages correspond au nom de l'entrée.


Formation recommandée sur ce thème :

Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Outils linguistiques de Google

  • Stratégies de mots-clés
    Cet outil vous permet de créer à partir de quelques mots-clés une liste d'expressions constituées des mots pris dans tous les ordres possibles. Il sert aux analyses de positionnement et achats de mots-clés.
  • Test HTTP header
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
  • Analyser le positionnement d'un site
    AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité