Supprimer massivement les pages 404 du cache (Code)
12 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

giviz - WRInaute discret

- Messages: 130
- Inscription: 18 Juil 2005
Supprimer massivement les pages 404 du cache (Code)
Salut à tous,
Voici pour ceux qui doivent supprimer beaucoup de pages 404 du cache de Google une manière de faire.
Avant toute chose je ne tiens pas à ouvrir le débat du "c'est bien de le faire ou ce n'est pas bien", vous pensez ce que vous voulez et ca vous regarde...
Pour ce qui doivent faire face à cette problématique comme c'était mon cas, voici comment supprimer ces pages à coup de 100 par 100 au lieu de 1 par 1.
Déjà il faut vous logguer sur
http://services.google.com:8882/urlconsole/controller?cmd=reload&lastcmd=login
Bien sur vous devez créer un compte pour ca.
Une fois loggué il vous faut ouvrir une seconde fenetre Google et effectuer correctement une recherche qui va vous lister uniquement les pages en 404 sur votre site.
Par exemple si vous avez supprimé un lot de pages dont le nom est de la forme 'aaaa-XXX.html'
Vous pourriez effectuer la recherche suivante :
Je vous recommande fortement d'avoir régler les préférences de Google pour afficher 100 résultats par page.
Ensuite il vous faut ajouter &filter=0 dans l'url pour virer les résultats complémentaires également.
Vous devez donc vous trouver devant une liste de 100 urls de pages en 404 présentes sur votre site.
Il ne vous reste plus qu'à enregistrer la page que vous avez sous les yeux sur votre ordi, et à la donner à manger au bout de code php que voici :
Ce bout de code doit etre ouvert dans le même navigateur ou vous etes loggué à urlconsole et votre session à urlconsole doit toujours etre valide (elle dure très peu de temps, genre 2 minutes).
Ce la va ouvrir 100 frames dans la fenetre affiché par le code, chaque frame se chargera d'ajouter un des résultats dans la liste des pages à supprimer du cache.
Il suffit ensuite de récupérer la page 2, puis la 3, etc...
Les pages sont supprimées sous un délai de 3 à 5 jours.
Seules les pages en 404 sur votre site seront supprimées.
Vous l'aurez compris, c'est une technique sans prétention destinée à traiter rapidement un problème que l'on ne peut pas traiter manuellement (qui va aller supprimer 3000 ou 4000 pages une par une...).
En espérant que ca puisse vous servir
Voici pour ceux qui doivent supprimer beaucoup de pages 404 du cache de Google une manière de faire.
Avant toute chose je ne tiens pas à ouvrir le débat du "c'est bien de le faire ou ce n'est pas bien", vous pensez ce que vous voulez et ca vous regarde...
Pour ce qui doivent faire face à cette problématique comme c'était mon cas, voici comment supprimer ces pages à coup de 100 par 100 au lieu de 1 par 1.
Déjà il faut vous logguer sur
http://services.google.com:8882/urlconsole/controller?cmd=reload&lastcmd=login
Bien sur vous devez créer un compte pour ca.
Une fois loggué il vous faut ouvrir une seconde fenetre Google et effectuer correctement une recherche qui va vous lister uniquement les pages en 404 sur votre site.
Par exemple si vous avez supprimé un lot de pages dont le nom est de la forme 'aaaa-XXX.html'
Vous pourriez effectuer la recherche suivante :
- Code: Tout sélectionner
site:www.exemple.com inurl:aaaa
Je vous recommande fortement d'avoir régler les préférences de Google pour afficher 100 résultats par page.
Ensuite il vous faut ajouter &filter=0 dans l'url pour virer les résultats complémentaires également.
Vous devez donc vous trouver devant une liste de 100 urls de pages en 404 présentes sur votre site.
Il ne vous reste plus qu'à enregistrer la page que vous avez sous les yeux sur votre ordi, et à la donner à manger au bout de code php que voici :
- Code: Tout sélectionner
<?
// search.html correspond à la page de résultats de google récupérée
$fd = fopen('search.html', 'r');
$datas = fread($fd, filesize('search.html'));
$i=0;
while($pos = strchr($datas, '<a class="l" ')) {
$datas = substr($pos, 19);
$pos = strchr($datas, '">');
$url = substr($datas, 0, strlen($datas) - strlen($pos));
echo '<iframe src="http://services.google.com:8882/urlconsole/controller?cmd=authenticateSiteDown&url='.urlencode($url).'&type=noindex"></iframe>';
$datas = $pos;
$i++;
}
?>
Ce bout de code doit etre ouvert dans le même navigateur ou vous etes loggué à urlconsole et votre session à urlconsole doit toujours etre valide (elle dure très peu de temps, genre 2 minutes).
Ce la va ouvrir 100 frames dans la fenetre affiché par le code, chaque frame se chargera d'ajouter un des résultats dans la liste des pages à supprimer du cache.
Il suffit ensuite de récupérer la page 2, puis la 3, etc...
Les pages sont supprimées sous un délai de 3 à 5 jours.
Seules les pages en 404 sur votre site seront supprimées.
Vous l'aurez compris, c'est une technique sans prétention destinée à traiter rapidement un problème que l'on ne peut pas traiter manuellement (qui va aller supprimer 3000 ou 4000 pages une par une...).
En espérant que ca puisse vous servir
-

ChauffeurDeBuzz - WRInaute passionné

- Messages: 1010
- Inscription: 31 Juil 2006
Ah ah excelent !!!... j'étais en train de me dire : ce topic pourrait intéresser Giviz 
-

giviz - WRInaute discret

- Messages: 130
- Inscription: 18 Juil 2005
ChauffeurDeBuzz a écrit:Ah ah excelent !!!... j'étais en train de me dire : ce topic pourrait intéresser Giviz
Hé hé, tu penses bien que j'allais pas laisser mon site avec toutes ces pages en 404, le pauvre
En tout cas cette méthode fonctionne très bien
- verozaure
- WRInaute discret

- Messages: 128
- Inscription: 7 Avr 2004
Même principe pour supprimer à la volée des pages en NOINDEX,NOFOLLOW
- Code: Tout sélectionner
<?
// search.html correspond à la page de résultats de google récupérée
$fd = fopen('search.html', 'r');
$datas = fread($fd, filesize('search.html'));
$i=0;
while($pos = strchr($datas, 'class=l ')) {
$datas = substr($pos, 14);
$pos = strchr($datas, '" onmousedown');
$url = substr($datas, 0, strlen($datas) - strlen($pos));
echo '<iframe src="http://services.google.com:8882/urlconsole/controller?cmd=authenticateMetaTags&metaTagsUrl='.urlencode($url).'"></iframe>';
$datas = $pos;
echo "$url<br>";
$datas = $pos;
$i++;
}
?>
-

bertimus - WRInaute passionné

- Messages: 2227
- Inscription: 24 Aoû 2005
yep parlait de la page google : http://services.google.com:8882/urlcons ... tcmd=login
Ca m'a fait la même chose, puis F5 et c'était bon
Ca m'a fait la même chose, puis F5 et c'était bon
- Tchinkatchuk
- WRInaute occasionnel

- Messages: 291
- Inscription: 22 Avr 2003
Re: Supprimer massivement les pages 404 du cache (Code)
Bonjour,
Cette méthode est-elle toujours valide ?
Cette méthode est-elle toujours valide ?
12 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- code 404 au lieu de code 200
- Supprimer pages du cache Yahoo
- Supprimer les pages en cache
- Supprimer une page dans le cache de Google
- Faire supprimer le cache Google pour des pages supprimées
- Erreur 404 com/cache.aspx... [MSN search ?]
- [GMail] Peut on exporter les messages massivement?
- Code 404 sur l'index
- Le code aspirine fabrique des 404 ?
- code 200 mais une erreur 404
Consultez la description détaillée des produits ou services de Google suivants : Google Code
- Analyseur d'entête HTTP
Cet outil vous permet de connaître le code HTTP renvoyé par le serveur pour une page donnée.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités

