Connexion page d'erreur : un vrai casse-tête !
12 messages
• Page 1 sur 1
- toto2525
- WRInaute occasionnel

- Messages: 349
- Inscription: 20 Sep 2007
Connexion page d'erreur : un vrai casse-tête !
Salut,
Je me suis aperçu qu'environ 1000 "internautes" par jour
passaient par ma page d'erreur (personnalisée) 404... totalisant plus de 2000 hits. J'en ai donc déduit qu'il devait y avoir un problème sur certaines de mes pages, ce qui devait provoquer cette erreur 404.
J'ai mis en place un script sur ma page d'erreur 404 qui met en base de données certaines infos des internautes qui arrivent sur ma page d'erreur 404, infos du type : date, IP, agent, host, referrer, système d'exploitation, navigateur, langue, proxy, nb visite.
Et là je m'aperçois que certains "internautes" sont venus plus de 50 fois sur cette page d'erreur 404 en une seule journée... quel être humain pourrait accepter cela sans partir immédiatement de ce site ? J'en déduit donc qu'il s'agit de crawler, de robot mais le problème c'est que ce n'est jamais la même IP, host, etc... comment les bloquer dans ces conditions ?
Est-ce quelqu'un a une idée ?
Merci pour votre aide.
Je me suis aperçu qu'environ 1000 "internautes" par jour
J'ai mis en place un script sur ma page d'erreur 404 qui met en base de données certaines infos des internautes qui arrivent sur ma page d'erreur 404, infos du type : date, IP, agent, host, referrer, système d'exploitation, navigateur, langue, proxy, nb visite.
Et là je m'aperçois que certains "internautes" sont venus plus de 50 fois sur cette page d'erreur 404 en une seule journée... quel être humain pourrait accepter cela sans partir immédiatement de ce site ? J'en déduit donc qu'il s'agit de crawler, de robot mais le problème c'est que ce n'est jamais la même IP, host, etc... comment les bloquer dans ces conditions ?
Est-ce quelqu'un a une idée ?
Merci pour votre aide.
- toto2525
- WRInaute occasionnel

- Messages: 349
- Inscription: 20 Sep 2007
Re: Connexion page d'erreur : un vrai casse-tête !
Merci pour ta réponse.
Il n'y a pas vraiment de pages précises qu'ils cherchent à joindre, ils passent un peu partout sur mon site et peuvent repasser plus de 30 fois par ma page d'accueil
je pige rien !
Il n'y a pas vraiment de pages précises qu'ils cherchent à joindre, ils passent un peu partout sur mon site et peuvent repasser plus de 30 fois par ma page d'accueil
- toto2525
- WRInaute occasionnel

- Messages: 349
- Inscription: 20 Sep 2007
Re: Connexion page d'erreur : un vrai casse-tête !
imaginons ceci :
Mon site : http://www.mon-site.com
2ième site : http://www.autre-site.com
Le 2ième site inclue dans ces pages des liens images avec mes url (hotlinking) du type http://www.mon-site.com/images/mon-image.jpg mais il se trouve que cette image n'existe plus sur mon site, cela va-t-il déclencher une erreur 404 sur mon site ?
Merci pour vos réponses.
Mon site : http://www.mon-site.com
2ième site : http://www.autre-site.com
Le 2ième site inclue dans ces pages des liens images avec mes url (hotlinking) du type http://www.mon-site.com/images/mon-image.jpg mais il se trouve que cette image n'existe plus sur mon site, cela va-t-il déclencher une erreur 404 sur mon site ?
Merci pour vos réponses.
-

tyv - WRInaute occasionnel

- Messages: 329
- Inscription: 6 Jan 2006
Re: Connexion page d'erreur : un vrai casse-tête !
oui je suis certain, c'est une connexion http classique qui n'aboutie pas et qui va générer une connexion 404.
Après empêcher le hotlinking, je ne sais pas. Ça dépend du type de site, de ce que cherchent à faire ceux qui le font, de ce que toi tu souhaites autoriser etc...
Tu pourrais aussi faire une redirection vers une image comportant un texte du genre "désolé cette ressource n'existe plus".
Après empêcher le hotlinking, je ne sais pas. Ça dépend du type de site, de ce que cherchent à faire ceux qui le font, de ce que toi tu souhaites autoriser etc...
Tu pourrais aussi faire une redirection vers une image comportant un texte du genre "désolé cette ressource n'existe plus".
Dernière édition par tyv le Mer Aoû 25, 2010 12:43, édité 1 fois.
-

tyv - WRInaute occasionnel

- Messages: 329
- Inscription: 6 Jan 2006
Re: Connexion page d'erreur : un vrai casse-tête !
Si tu as des logs "brut" tu devrais les trouver facilement.
Par exemple dans cette ligne de log:
Ci-dessus: piwik.js est ce qui n'a pas pu être chargé (pour toi ce seront tes images) et "http://www.adminoweb.com/articles/article12.html" est la page qui a cherchée à l'afficher.
Par exemple dans cette ligne de log:
- Code: Tout sélectionner
85.11.198.146 - - [25/Aug/2010:13:37:15 +0200] "GET /piwik.js HTTP/1.1" 404 270 "http://www.adminoweb.com/articles/article12.html" "Mozilla/5.0 (Windows; U; Windows NT 5.1; sv-SE; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 ( .NET CLR 3.5.3072
Ci-dessus: piwik.js est ce qui n'a pas pu être chargé (pour toi ce seront tes images) et "http://www.adminoweb.com/articles/article12.html" est la page qui a cherchée à l'afficher.
- toto2525
- WRInaute occasionnel

- Messages: 349
- Inscription: 20 Sep 2007
Re: Connexion page d'erreur : un vrai casse-tête !
Si ça peut servir à quelqu'un, j'ai trouvé la cause de toutes ces connexions à ma page d'erreur 404, il s'agissait de la petite icone favicon.ico qui n'existait pas sur mon site, il y a apparement une requête qui la demandait à chaque ouverture de page et s'il ne la trouvait pas ça procurait une erreur 404.
J'ai ajouté cette icone favicon.ico sur mon site et depuis je n'ai pas constaté une seule erreur 404, c'est dingue ce favicon.ico
J'ai ajouté cette icone favicon.ico sur mon site et depuis je n'ai pas constaté une seule erreur 404, c'est dingue ce favicon.ico
-

jeanluc - WRInaute accro

- Messages: 3062
- Inscription: 3 Mai 2004
Re: Connexion page d'erreur : un vrai casse-tête !
Bonjour,
Un analyseur de log comme AWStats t'aurait donné l'info immédiatement.
Cela dit, ce que je ne comprends pas, c'est que tu ne voyais pas cette URL du favicon en examinant les données récoltées par le script de ta page 404 (celui dont tu parles dans ton premier post).
Jean-Luc
Un analyseur de log comme AWStats t'aurait donné l'info immédiatement.
Cela dit, ce que je ne comprends pas, c'est que tu ne voyais pas cette URL du favicon en examinant les données récoltées par le script de ta page 404 (celui dont tu parles dans ton premier post).
Jean-Luc
- toto2525
- WRInaute occasionnel

- Messages: 349
- Inscription: 20 Sep 2007
Re: Connexion page d'erreur : un vrai casse-tête !
En fait j'ai trouvé la réponse à mon problème grâce à cet outil http://www.webpagetest.org qui permet d'obtenir toutes les "Request Headers" des éléments de ta page et d'avoir aussi les codes réponses "Response Headers".
12 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
- Casse-tête
- Casse tête MySQL
- casse tête 301
- Casse-tête inside
- casse-tete creation de socièté
- Casse tête chinois et redirection sauvage
- Menu CSS et icones... casse tete
- corriger les balises un casse tête?
- Google Analytics et les pdf: le casse tête
- Un casse tête de conception de site en vue de son référencement
- Honda va inclure Google Earth dans son système de navigation par satellite - 07-04-2006
- Barre d'outils Google pour Firefox : version 3 - 13-12-2006
- Vidéos YouTube 4096 x 3072 pixels (4K) - 12-07-2010
- Soft 404 : les pages d'erreurs avec un code HTTP 200 - 08-06-2010
- Article sur le fichier .htaccess - 11-01-2003
- Nombreuses erreurs 404 : impact sur le référencement - 30-03-2010
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité
