Des tonnes d'accès par jour à des pages inexistantes

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics

noren
WRInaute accro
WRInaute accro
 
Messages: 2847
Enregistré le: 8 Avr 2011

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 13:33

J'ai installé DNSSEC qui normalement empêche l'IP spoofing (ou cache poisoning)
Je ne sais pas si il est possible d'avoir dans ses logs des IP de Google mais qui n'en sont pas vraiment. Dans le doute ca me parait trop risqué de l'envoyer balader.

Et comment expliquer également que googlebot n'explore quasiment plus mes pages d'articles.

elji
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 262
Enregistré le: 6 Juin 2009

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 13:57

Oui, j'ai bien vu cela. La plupart de mes 404 sont pour des pages qui pourraient exister, je les vois alors comme des tentatives de hack. Je suis juste surpris d'en avoir tant, tous les jours. J'imagine que je pourrais créer des répertoires
/blog
/admin
/wp
/js
/common
avec des 410 pour diminuer mes 404... Je ne sais pas si ce serait une bonne idée.

A part cela, noren, as-tu des ennemis ?
Ce qui me choque, est que ces robots inventent toujours de nouvelles URLs. Moi, c'est toujours les mêmes qui reviennent. Il faut qu'il y ait un script quelque part, pour que le robot aille toujours inventer de nouvelles URLs. Un javascript ou un URL-rewriting quelconque.

noren
WRInaute accro
WRInaute accro
 
Messages: 2847
Enregistré le: 8 Avr 2011

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 14:04

Les ennemis se sont tous les concurrents, donc oui dans mon secteur il y en a un paquet
Oui les bots continuent toujours d'inventer ces URL. Comme indiqué meme si ca venait de mon côté (javascript mal codé, un script qui pose soucis ...) je ne devrait pas avoir de bots liés a adsense car je n'ai ajouté nulle par le script pour ajouter des pubs adsense.

J'ai uploadé tous mon site et ma BDD, fait des recherche pour voir si un script ou du code avait été ajouté et il y a quedalle
Tout porte a croire que ce pb vient de l'extérieur.


indigene
WRInaute accro
WRInaute accro
 
Messages: 3258
Enregistré le: 7 Sep 2003

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 14:18

je ne suis pas expert en réseau mais à mon avis :

- ce n'est pas toi qui est la cible d'une attaque
- celui qui utilise ton site en envoyant des requêtes avec de l'ip spoofing vise en fait google mediapartners car la réponse (404 en l'occurence) sera retournée à google mediapartners puisque c'est son ip qui est à l'origine de la requête.
- indirectement ça peut te causer des ennuis car google mediapartners pense que tu le bombardes de requêtes avec toutes les réponses 404 qu'il reçoit de chez toi

Donc selon moi il ne faut pas répondre 404 ou 503 mais dégager ces requêtes vers autre chose par une 301. C'est le site destinataire qui sera alors pris en compte par google mediapartners et tu as moins de chances d'être inquiété

Mais je suis tellement une brelle en réseau qu'un spécialiste pourrait certainement démonter mon raisonnement très facilement. Enfin moi ça me parait logique que ça fonctionne de la sorte.

C'est clair en tous cas qu'il ne faut pas bloquer les ip ni le user agent car ces ip réelles ou ces user agents n'y sont pour rien. Et ça ne me parait pas normal non plus de répondre 404 à des ip qui n'ont rien demandé. 301 me semble plus approprié même si ce n'est pas la solution. Il faudrait pouvoir remonter à l'ip d'origine mais ça je ne sais pas comment faire à moins d'être OVH et d'avoir accès à plus de données sur les serveurs. Toi tu reçois une requête en provenance d'une ip et tu ne peux que subir. S'il faut un filtre c'est en amont.

noren
WRInaute accro
WRInaute accro
 
Messages: 2847
Enregistré le: 8 Avr 2011

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 14:49

je dois avouer que je ne sais réellement pas quelle solution appliquée : 301, 404 ou si j'envoi baladé lorsqu'ils acédent a des pages inexistantes

Je viens de voir que j'ai maintenant ce type d'accès dans mes logs :

Code: Tout sélectionner
64.125.188.25 www.monsite.ext - [12/Dec/2016:02:50:33 +0100] "GET /pixel.php?domain=www.monsite.ext&idx=1714&method=pageVisit&message=undefined HTTP/1.1" 404 828 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.1) Gecko/2008070208 Firefox/3.0.1"


C'est pas net tout ça.


indigene
WRInaute accro
WRInaute accro
 
Messages: 3258
Enregistré le: 7 Sep 2003

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 14:59

Je comprend ton désarroi. C'est un peu comme quand on reçoit des lettres des impôts et des PV de toutes parts. C'est toujours embêtant de s'en débarasser

noren
WRInaute accro
WRInaute accro
 
Messages: 2847
Enregistré le: 8 Avr 2011

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 16:19

Autant dire que c'est une belle m*rde

patrick_lejeune
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 341
Enregistré le: 1 Avr 2016

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Lun Déc 12, 2016 21:31

elji a écrit:/blog
/admin
/wp
/js
/common

Je pourais t'en présenter d'autres: des pages d'administration de CMS Sans utiliser de CMS, j'ai tous les jours ce genres de visiteurs. Même mieux, un page (par example) qui parle de oscommerce.php recoit des tentatives d'hacking sue le CMS OScommerce

elji
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 262
Enregistré le: 6 Juin 2009

Re: Des tonnes d'accès par jour à des pages inexistantes

Message le Mar Déc 13, 2016 12:31

patrick_lejeune a écrit:
elji a écrit:/blog
/admin
/wp
/js
/common

Je pourais t'en présenter d'autres: des pages d'administration de CMS Sans utiliser de CMS, j'ai tous les jours ce genres de visiteurs. Même mieux, un page (par example) qui parle de oscommerce.php recoit des tentatives d'hacking sue le CMS OScommerce


Oui, on est bien d'accord. Mais la conséquence est que je surveille très mal mes 404. Je voudrais faire du bon travail, mais quand je regarde, les vrais 404 représentent moins de 0,5% de tous les 404 que je reçois. Au lieu d'avoir un fichier d'erreurs qui ne fait que quelques lignes, j'ai devant les yeux un truc énorme, alors il faut du temps...


Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et comment éviter ou sortir d'une pénalité manuelle ou algorithmique due aux liens. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :