Rewriting et problèmes avec certains moteurs

Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics

Grand-Pas
WRInaute discret
WRInaute discret
 
Messages: 107
Inscription: 17 Juin 2003

Rewriting et problèmes avec certains moteurs

Message le Mar Juil 22, 2003 20:11

Bonjour,

J'ai mis en place le rewriting pour mon site début juillet et j'attends patiemment les retombées...
Cependant j'ai quelques problèmes avec certains moteurs.
voici les erreurs 404 que je reçois :
Code: Tout sélectionner
HTTP_FROM => mailto:crawl-support@av.com
HTTP_HOST => www.domainegorn.com
HTTP_USER_AGENT => Scooter/3.2
PATH => /sbin:/usr/sbin:/bin:/usr/bin:/usr/X11R6/bin
REDIRECT_ERROR_NOTES => File does not exist: /home/sites/site143/web/series/index_pouvoir
REDIRECT_REQUEST_METHOD => GET
REDIRECT_SCRIPT_URI => http://www.domainegorn.com/series/index_pouvoir
REDIRECT_SCRIPT_URL => /series/index_pouvoir


Pour info la bonne URL est :
http://www.domainegorn.com/series/index_pouvoir.html

ou encore

Code: Tout sélectionner
HTTP_USER_AGENT => ASPseek/1.2.10
PATH => /sbin:/usr/sbin:/bin:/usr/bin:/usr/X11R6/bin
REDIRECT_ERROR_NOTES => File does not exist: /home/sites/site143/web/series/index_.html
REDIRECT_REQUEST_METHOD => GET
REDIRECT_SCRIPT_URI => http://www.domainegorn.com/series/index_.html
REDIRECT_SCRIPT_URL => /series/index_.html


J'avoue être perplexe :D

Est-ce que quelqu'un pourrait me dire se qui se passe exactement.
Par avance merci

Grand-Pas


Qaghan
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 316
Inscription: 11 Juin 2003

Message le Mar Juil 22, 2003 22:08

Je confirme que les pages /series/index_.html et /series/index_pouvoir renvoient des erreurs 404...

La question qu'on peut se poser c'est:

Comment est-ce que les moteurs ont fait pour collecter ces urls erronees ?

Si tu generes les liens vers les fichiers series/index_nomdeserie.html grace a une requete vers une BdD, verifie tes scripts php... Un debordement de tableau est si vite arrive...

En ce qui concerne le /series/index_pouvoir, je ne vois pas ce qui aurait pu causer l'oubli du html...

Ton site etait-il accessible lorsque tu faisais des developpements ? As-tu constate et corrige ce genre de bugs ? Si oui, on peut penser que les crawlers sont passes au mauvais moment...

Autre hypothese: Ces moteurs essaient peut-etre de dejouer d'eventuels pieges a bot utilisant l'UR... Constatant l'existence de nombreuses url basees sur le meme principe index_nomdefichier.html, ils ont peut-etre tout simplement tente de prendre la page index_.html... Les pieges a bots ne doivent pas renvoyer d'erreur 404 quand les parametres sont invalides... Enfin ceci n'est qu'une hypothese...

Quelqu'un a-t-il deja constate ce genre de comportement chez des bots ?

Olivier,

Grand-Pas
WRInaute discret
WRInaute discret
 
Messages: 107
Inscription: 17 Juin 2003

Message le Mar Juil 22, 2003 22:37

Hello,

Merci pour ta réponse.
Concernant le débordement de tableau je ne vois pas trop ce que tu veux dire ?
Les liens sont générés via BdD. Jusqu'à présent aucun problème de connexion constatée au niveau de la base....

Par contre c'est possible que les crawlers soient passés pendant mes développements sur l'url rewriting et alors là pas de chance... :(
Mais j'ai plus l'impression qu'ils continuent à passer et à se casser les dents.

Bizarre....

GP

gus
Nouveau WRInaute
Nouveau WRInaute
 
Messages: 5
Inscription: 9 Avr 2003

Message le Mer Juil 23, 2003 9:29

Salut,

j'ai aussi remarqué ce genre de problème avec Scooter, 2 ex :

HTTP_USER_AGENT : Scooter/3.2
REDIRECT_STATUS : 404
REDIRECT_URL : /contact.ph
(au lieu contact.php)

HTTP_USER_AGENT : Scooter/3.2
REDIRECT_STATUS : 404
REDIRECT_URL : /forums/topic_7
(au lieu /forums/topic_739.php)

Ces pages n'ayant bien sur jamais existé, ça peut pas etre un problème du genre "il est passé pendant le dev." ... Etrange ...

Gus


Qaghan
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 316
Inscription: 11 Juin 2003

Message le Mer Juil 23, 2003 13:53

Bon, je viens de faire une recherche sur le forum en tapant Scooter (ce que l'on devraitd'ailleurs toujours faire avant de poser une question ;-)

Le sujet a deja ete aborde dans ce fil: http://www.webrankinfo.com/forums/viewtopic.php?p=18136

Il semble que Scooter soit bogue...

Olivier,

Grand-Pas
WRInaute discret
WRInaute discret
 
Messages: 107
Inscription: 17 Juin 2003

Message le Mer Juil 23, 2003 23:13

Arf j'avais pourtant cherché mais pas sur le scooter :)

En fait j'ai surtout posé la question car cela ne m'arrive pas qu'avant le scooter... il y a un second drôle dans l'histoire : Aspseek.

En tout cas maintenant le scooter il recherche des urls à base de chiffres et je ne sais absolument pas d'où il les sort.. je reçois des erreurs 404 assez étranges :mrgreen:

En tout cas merci pour votre aide. Cela me rassures je commencais à avoir des sueurs froides en me demanant comment j'avais bien pu foirer mon rewriting :D

@+
GP


Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

  • Détection de pages similaires
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Test de lien (type de redirection)
    Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
  • Analyser le positionnement d'un site
    AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités