Fraicheur des crawls images de exalead ?
17 messages • Page 1 sur 2 • 1, 2
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Fraicheur des crawls images de exalead ?
Je suis crawlé par exabot, mais exabot utilise comme base pour les images des pages assez vieilles (4-5 mois).
J'avais change tous mes chemin d'images dans le code de
/image/image.jpg
à
www.example.com/image/image.jpg
car les robots ont du mal avec l'UR et cela créaient des erreur 404.
exabot utilisent les anciens fichiers -> erreur 404.
J'avais change tous mes chemin d'images dans le code de
/image/image.jpg
à
www.example.com/image/image.jpg
car les robots ont du mal avec l'UR et cela créaient des erreur 404.
exabot utilisent les anciens fichiers -> erreur 404.
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Vous pouvez m'envoyer en mp plus d'infos pour que je puisse regarder d'ou çà vient ?
Merci
Par ailleurs, surveillez bien, cette semaine, une nouvelle version du moteur images devrait apparaitre. Au menu bp plus d'images et des fonctionalités inédites...
Merci
Par ailleurs, surveillez bien, cette semaine, une nouvelle version du moteur images devrait apparaitre. Au menu bp plus d'images et des fonctionalités inédites...
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Suite au mp de Suede, je viens d'investiguer son probleme, nous avions un bug à un moment dans notre gestion du tag BASE du coté du moteur images qui a été corrigé dernierement, ce qui fait que nous avons crawlé un certain nombre de faux liens.
Néanmoins, j'ai vérifié et a priori nous avons neanmoins reussi à recuperer les vrais liens et les images du site en question sont presentes en plus grand nombre dans la nouvelle version de notre moteur images (en cours de lancement cette semaine) que dans le moteur images de G....e
Néanmoins, j'ai vérifié et a priori nous avons neanmoins reussi à recuperer les vrais liens et les images du site en question sont presentes en plus grand nombre dans la nouvelle version de notre moteur images (en cours de lancement cette semaine) que dans le moteur images de G....e
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
La nouvelle version dont je parlais est maintenant en ligne
plus d'infos ici:
http://blog.exalead.fr/2007/04/exalead_recherc.html
plus d'infos ici:
http://blog.exalead.fr/2007/04/exalead_recherc.html
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Oui il s'agit du robot d'Exalead.
Pour verifier l'authenticité d'un robot vous pouvez faire du reverse dns :
host 193.47.80.38
38.80.47.193.in-addr.arpa domain name pointer crawl2.exabot.com.
cf http://www.exalead.fr/about/document/53#7
Pour verifier l'authenticité d'un robot vous pouvez faire du reverse dns :
host 193.47.80.38
38.80.47.193.in-addr.arpa domain name pointer crawl2.exabot.com.
cf http://www.exalead.fr/about/document/53#7
j'ai du bloquer le spider Exabot-Thumbnails, il ne lit pas le fichier robots.txt et s'amuse à lire le contenu des css pour récupérer des images n'existant pas, du fait que toutes les classes ne sont pas utilisées.
De toutes façons, pour le nombre de visiteurs en provenance de exalead : environ 0,2% de gg
De toutes façons, pour le nombre de visiteurs en provenance de exalead : environ 0,2% de gg
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Ma reponses en plusieurs points
1) Exabot-Thumbnails ne genere des thumbnails que pour les urls crawlées par Exabot qui lui n'indexe que des pages qui sont autorisés par le fichier robots.txt
2) Exabot-Thumbnails est essentiellement un browser standard du marché legerement customisé. Il tire les memes ressources qu'un browser normal.
3) Les personnes qui ne veulent pas de thumbnail pour leurs pages peuvent rajouter <META NAME = "ROBOTS" CONTENT = "NOTHUMBNAIL" > a leurs pages
cf http://www.exalead.com/about/document/53#17
4) Robots.txt n'est pas clair sur les usages exacts et sur ce que Disallow est censé interdire vis à vis des multi usages crawl / indexation / mise en cache / thumbnails etc.
Exalead est conscient de ces limitations et est le premier moteur a avoir rejoint l'ACAP http://www.the-acap.org/ qui a pour but de creer un standard qui etend et standardise les possibilités du robots exclusion protocol.
1) Exabot-Thumbnails ne genere des thumbnails que pour les urls crawlées par Exabot qui lui n'indexe que des pages qui sont autorisés par le fichier robots.txt
2) Exabot-Thumbnails est essentiellement un browser standard du marché legerement customisé. Il tire les memes ressources qu'un browser normal.
3) Les personnes qui ne veulent pas de thumbnail pour leurs pages peuvent rajouter <META NAME = "ROBOTS" CONTENT = "NOTHUMBNAIL" > a leurs pages
cf http://www.exalead.com/about/document/53#17
4) Robots.txt n'est pas clair sur les usages exacts et sur ce que Disallow est censé interdire vis à vis des multi usages crawl / indexation / mise en cache / thumbnails etc.
Exalead est conscient de ces limitations et est le premier moteur a avoir rejoint l'ACAP http://www.the-acap.org/ qui a pour but de creer un standard qui etend et standardise les possibilités du robots exclusion protocol.
pour ce qui me concerne, sur plusieurs site, il s'amuse à crawler des url d'images qui ne sont disponibles que dans les feuilles de styles externes. J'ai une feuille de style qui contient des classes n'étant pas utilisées actuellement, et de ce fait, je n'ai pas besoin des images correspondantes et Exabot-Thumbnails s'amuse à me crawler ces liens, malgré le fait que le répertoire soit indiqué dans les disalow.ExaleadGuy a écrit:Ma reponses en plusieurs points
1) Exabot-Thumbnails ne genere des thumbnails que pour les urls crawlées par Exabot qui lui n'indexe que des pages qui sont autorisés par le fichier robots.txt
C'est le seul moteur qui s'amuse à me crawler ces images inexistantes.
J'ai l'impression que la priorité semble être le crawl des images au détriment du contenu textuel
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Precision: Exabot-Thumbnails n'indexe rien : il construit uniquement les vignettes des pages donc forcement recupere les css et les images associées aux pages qui ont été indexé par le bot principal Exabot.
Exabot-Thumbnail a le meme comportement qu'un browser utilisateur.
Exabot-Thumbnail a le meme comportement qu'un browser utilisateur.
sauf qu'avec un browser utilisateur, je n'ai pas d'erreur 404 car il va chercher des images de classes non utilisées sur le siteExaleadGuy a écrit:Precision: Exabot-Thumbnails n'indexe rien : il construit uniquement les vignettes des pages donc forcement recupere les css et les images associées aux pages qui ont été indexé par le bot principal Exabot.
Exabot-Thumbnail a le meme comportement qu'un browser utilisateur.
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Mais as tu testé tous les browsers sur toutes tes pages pour etre sur de ce que tu avances ?
non, plus simple, j'ai un envoi de mel sur toutes mes erreurs 404 et il n'y a qu'Exabot-Thumbnails qui les créeExaleadGuy a écrit:Mais as tu testé tous les browsers sur toutes tes pages pour etre sur de ce que tu avances ?
-

ExaleadGuy - Officiel Exalead
- Messages: 126
- Inscription: Mar Aoû 09, 2005 14:08
Exabot Thumbnails est basé sur KHTML de la meme facon que Konqueror et dans une moindre mesure Safari. Donc Konqueror au minimum devrait generer les memes erreurs.
17 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Exalead crée une interface pour iPhone et iPod Touch
- Tester son positionnement dans Exalead avec Agent Web Ranking
- Interview de François Bourdoncle (Exalead)
- Exalead dialogue sur le nouveau forum Exalead de WebRankInfo
- 15-02-2006 : Interview Exalead sur le chat de WebRankInfo
- Référencement vidéo sur Exalead
- Exalead rejoint le protocole Sitemaps.org
- Exalead améliore son interface
- WebRankInfo élu meilleur forum référencement
- L'assistant de recherche sur Yahoo! Search France
- [Exalead] Nouveau moteur de recherche dimages
- fréquence des crawls
- Bannir les crawls de particulier...
- Quels crawls pour google ?
- 2 questions : Msn Bot et Crawls non souhaités...
- Full crawls et nombre de pages réellement indéxées
- A quoi servent des crawls de Google aussi fréquents ?
- Nombreux crawls sur tous mes sites venant d'une même IP
- Fraicheur
- Surprime de fraicheur
- prime de fraicheur ?
- Prime de fraicheur ??
- déprime fraicheur
- Référencement : prime de fraîcheur
- prime fraicheur -->4 jours !!!
Consultez la description détaillée des produits ou services de Google suivants : Google Images, Hello, Google Suggest, Google Image Labeler
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum