Supprimer massivement les pages 404 du cache (Code)

Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics


giviz
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 130
Inscription: Lun Juil 18, 2005 14:36

Supprimer massivement les pages 404 du cache (Code)

Message le Mar Nov 21, 2006 10:15

Salut à tous,

Voici pour ceux qui doivent supprimer beaucoup de pages 404 du cache de Google une manière de faire.
Avant toute chose je ne tiens pas à ouvrir le débat du "c'est bien de le faire ou ce n'est pas bien", vous pensez ce que vous voulez et ca vous regarde...

Pour ce qui doivent faire face à cette problématique comme c'était mon cas, voici comment supprimer ces pages à coup de 100 par 100 au lieu de 1 par 1.

Déjà il faut vous logguer sur

http://services.google.com:8882/urlconsole/controller?cmd=reload&lastcmd=login
Bien sur vous devez créer un compte pour ca.

Une fois loggué il vous faut ouvrir une seconde fenetre Google et effectuer correctement une recherche qui va vous lister uniquement les pages en 404 sur votre site.

Par exemple si vous avez supprimé un lot de pages dont le nom est de la forme 'aaaa-XXX.html'

Vous pourriez effectuer la recherche suivante :
Code: Tout sélectionner
site:www.exemple.com inurl:aaaa


Je vous recommande fortement d'avoir régler les préférences de Google pour afficher 100 résultats par page.

Ensuite il vous faut ajouter &filter=0 dans l'url pour virer les résultats complémentaires également.

Vous devez donc vous trouver devant une liste de 100 urls de pages en 404 présentes sur votre site.

Il ne vous reste plus qu'à enregistrer la page que vous avez sous les yeux sur votre ordi, et à la donner à manger au bout de code php que voici :

Code: Tout sélectionner
<?

// search.html correspond à la page de résultats de google récupérée
$fd = fopen('search.html', 'r');
$datas = fread($fd, filesize('search.html'));

$i=0;
while($pos = strchr($datas, '<a class="l" ')) {
    $datas = substr($pos, 19);
    $pos = strchr($datas, '">');
    $url = substr($datas, 0, strlen($datas) - strlen($pos));
        echo '<iframe src="http://services.google.com:8882/urlconsole/controller?cmd=authenticateSiteDown&url='.urlencode($url).'&type=noindex"></iframe>';
    $datas = $pos;
    $i++;
}

?>


Ce bout de code doit etre ouvert dans le même navigateur ou vous etes loggué à urlconsole et votre session à urlconsole doit toujours etre valide (elle dure très peu de temps, genre 2 minutes).

Ce la va ouvrir 100 frames dans la fenetre affiché par le code, chaque frame se chargera d'ajouter un des résultats dans la liste des pages à supprimer du cache.

Il suffit ensuite de récupérer la page 2, puis la 3, etc...

Les pages sont supprimées sous un délai de 3 à 5 jours.
Seules les pages en 404 sur votre site seront supprimées.

Vous l'aurez compris, c'est une technique sans prétention destinée à traiter rapidement un problème que l'on ne peut pas traiter manuellement (qui va aller supprimer 3000 ou 4000 pages une par une...).

En espérant que ca puisse vous servir ;)

oxman
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 118
Inscription: Lun Juin 21, 2004 1:52

Message le Mar Nov 21, 2006 13:08

Merci chef =)


ChauffeurDeBuzz
WRInaute passionné
WRInaute passionné
 
Messages: 986
Inscription: Lun Juil 31, 2006 21:00

Message le Mer Nov 22, 2006 8:08

Ah ah excelent !!!... j'étais en train de me dire : ce topic pourrait intéresser Giviz ;)


giviz
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 130
Inscription: Lun Juil 18, 2005 14:36

Message le Mer Nov 22, 2006 9:22

ChauffeurDeBuzz a écrit:Ah ah excelent !!!... j'étais en train de me dire : ce topic pourrait intéresser Giviz ;)


Hé hé, tu penses bien que j'allais pas laisser mon site avec toutes ces pages en 404, le pauvre :P

En tout cas cette méthode fonctionne très bien ;)

yep
WRInaute impliqué
WRInaute impliqué
 
Messages: 286
Inscription: Sam Avr 03, 2004 12:02

Message le Mar Nov 28, 2006 9:33

ton astuce semble géniale, mais la page donnée m'indique que je dois activer les cookies (alors qu'ils sont actifs :p)


giviz
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 130
Inscription: Lun Juil 18, 2005 14:36

Message le Mar Nov 28, 2006 11:55

Quand tu dis la page donnée, tu parles de quelle page ?

verozaure
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 128
Inscription: Mer Avr 07, 2004 21:59

Message le Sam Déc 02, 2006 12:17

Même principe pour supprimer à la volée des pages en NOINDEX,NOFOLLOW


Code: Tout sélectionner
<?

// search.html correspond à la page de résultats de google récupérée
$fd = fopen('search.html', 'r');
$datas = fread($fd, filesize('search.html'));

$i=0;
while($pos = strchr($datas, 'class=l ')) {
    $datas = substr($pos, 14);
    $pos = strchr($datas, '" onmousedown');
    $url = substr($datas, 0, strlen($datas) - strlen($pos));
echo '<iframe src="http://services.google.com:8882/urlconsole/controller?cmd=authenticateMetaTags&metaTagsUrl='.urlencode($url).'"></iframe>';
    $datas = $pos;
    echo "$url<br>";
   $datas = $pos;
    $i++;
}

?>

ACth
WRInaute passionné
WRInaute passionné
 
Messages: 795
Inscription: Sam Nov 11, 2006 12:32

Message le Sam Déc 02, 2006 13:32

Elles ne sont pas supprimées automatique les pages inaccessibles, au bout d'un certain temps ?


giviz
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 130
Inscription: Lun Juil 18, 2005 14:36

Message le Sam Déc 02, 2006 14:42

Si, plusieurs mois, donc quand tu en a quelques 10000...

ACth
WRInaute passionné
WRInaute passionné
 
Messages: 795
Inscription: Sam Nov 11, 2006 12:32

Message le Sam Déc 02, 2006 14:51

giviz a écrit:Si, plusieurs mois, donc quand tu en a quelques 10000...

ok, mais quel est la contrainte pour toi d'avoir ces pages encore dans le cache des différents moteurs ?


bertimus
WRInaute accro
WRInaute accro
 
Messages: 2227
Inscription: Mer Aoû 24, 2005 11:51

Message le Lun Déc 04, 2006 0:06

yep parlait de la page google : http://services.google.com:8882/urlcons ... tcmd=login
Ca m'a fait la même chose, puis F5 et c'était bon ;)


Formation recommandée sur ce thème :

Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Google Code

  • Analyseur d'entête HTTP
    Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


cron