Stratégie de crawl de Yahoo-VerticalCrawler
3 messages
• Page 1 sur 1
Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics
-

Digit - WRInaute impliqué

- Messages: 613
- Inscription: 18 Avr 2003
Stratégie de crawl de Yahoo-VerticalCrawler
Petite analyse qui pourra vous intéresser.
Yahoo-VerticalCrawler est le bot de shoping.yahoo.com. Voici son empreinte :
Aujourd'hui il a parcouru un site de la manière suivante :
1- crawl page principale (/)
2- attente 3h avant de lancer l'artillerie : généralement une page crawlée toutes les 10 secondes, toujours depuis le même serveur (shop-gw.sac.overture.com)
3- l'ordre des crawl est un classement des liens de chaque page analysée : priorité racine (/) puis pages de premier niveau (/xxx.php) puis répertoires de premier niveau (/yyy/) puis liens paramétrés (/yyy/?param=valeur).
4- Ensuite il attend à nouveau 3 heures et rebalance la sauce avec toujours une moyenne d'une page toutes les 10 secondes : url de type /yyyy/ puis /yyyy/xxx.php puis /xxxx.php?param=valeur puis /yyy/zzz/ puis /yyy/?param=valeur puis /yyy/zzz/?param=valeur
On peut donc supposer que le bot privilégie le crawl des pages auxquelles il donne le plus d'importance. On obtient donc des URL selon la priorité suivante :
- /
- /xxx.php
- /yyy/
- /yyy/xxx.php
- /xxx.php?param=valeur
- /yyy/zzz/
- /yyy/?param=valeur
- /yyy/zzz/?param=valeur
En conclusion, éviter les répertoires à profondeur multiple et les paramètres dans l'URL.
Une stratégie d'url rewriting consisterait donc à traduire les pages dynamiques en fausses pages statiques de premier niveau.
Yahoo-VerticalCrawler est le bot de shoping.yahoo.com. Voici son empreinte :
- Code: Tout sélectionner
shop-gw.sac.overture.com - - [17/Mar/2004:10:52:40 +0100] "GET / HTTP/1.0" 200 27571 "-" "Yahoo-VerticalCrawler-FormerWebCrawler/3.9 crawler at trd dot overture dot com; http://www.alltheweb.com/help/webmaster/crawler"
Aujourd'hui il a parcouru un site de la manière suivante :
1- crawl page principale (/)
2- attente 3h avant de lancer l'artillerie : généralement une page crawlée toutes les 10 secondes, toujours depuis le même serveur (shop-gw.sac.overture.com)
3- l'ordre des crawl est un classement des liens de chaque page analysée : priorité racine (/) puis pages de premier niveau (/xxx.php) puis répertoires de premier niveau (/yyy/) puis liens paramétrés (/yyy/?param=valeur).
4- Ensuite il attend à nouveau 3 heures et rebalance la sauce avec toujours une moyenne d'une page toutes les 10 secondes : url de type /yyyy/ puis /yyyy/xxx.php puis /xxxx.php?param=valeur puis /yyy/zzz/ puis /yyy/?param=valeur puis /yyy/zzz/?param=valeur
On peut donc supposer que le bot privilégie le crawl des pages auxquelles il donne le plus d'importance. On obtient donc des URL selon la priorité suivante :
- /
- /xxx.php
- /yyy/
- /yyy/xxx.php
- /xxx.php?param=valeur
- /yyy/zzz/
- /yyy/?param=valeur
- /yyy/zzz/?param=valeur
En conclusion, éviter les répertoires à profondeur multiple et les paramètres dans l'URL.
Une stratégie d'url rewriting consisterait donc à traduire les pages dynamiques en fausses pages statiques de premier niveau.
-

WebRankInfo - Administrateur du site

- Messages: 19420
- Inscription: 19 Avr 2002
c'est marrant sur un forum US un mec de Yahoo ne semblait pas vouloir donner trop d'infos sur ce bot.
je pense qu'un moteur shopping digne de ce nom serait un très gros avantage pour Yahoo
et en plus ils ont un robot qui récupère des images en ce moment, et on n'en parle pas trop...
je pense qu'un moteur shopping digne de ce nom serait un très gros avantage pour Yahoo
et en plus ils ont un robot qui récupère des images en ce moment, et on n'en parle pas trop...
-

Digit - WRInaute impliqué

- Messages: 613
- Inscription: 18 Avr 2003
Leur bot de shoping est en test depuis plusieurs mois, avant il avait un autre nom. Ce qui est remarquable c'est la capacité à analyser les pages pour en extraire automatiquement le nom du produit, son prix etc... et de mettre le tout en forme de manière cohérente dans leur listing, parfois mieux que sur le site d'origine. Et en plus ils m'ont inclus des centaines de produits de mes sites, gratuitement, alors c'est encore mieux
Qui disait que Yahoo était trop payant ?
Petit bémol, les prix doivent être en affichés $ car les euros ne sont pas encore gérés.
Qui disait que Yahoo était trop payant ?
Petit bémol, les prix doivent être en affichés $ car les euros ne sont pas encore gérés.
3 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Yahoo-VerticalCrawler
- Crawl Yahoo
- gros crawl yahoo slurp
- Semi full crawl de Yahoo Slurp
- yahoo crawl les page en css
- Yahoo et son deep crawl inutile!
- Yahoo Search : mise à jour de l'algo, de l'index et du crawl
- Question sur stratégie d'achats de mots clés sur yahoo search marketing
- Yahoo premier en terme de "crawl", et à peine 5 % du traffic...
Consultez la description détaillée des produits ou services de Google suivants : Google Sitemaps
- Trouver la position d'un site dans Yahoo
Cet outil vous permet de vérifier si une ou plusieurs page(s) de votre site arrive(nt) dans les premiers résultats de Yahoo, pour certains mots-clés recherchés. - Logiciel de référencement AgentWebRanking
AgentWebRanking est un logiciel professionnel qui permet d'analyser le positionnement d'un ou plusieurs sites dans plus de 300 moteurs de recherche dans le monde. Vous pouvez ainsi analyser les performances du référencement pour de nombreux mots-clés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
