Robots et la balise..."Robots"CONTENT="index,
5 messages • Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
Robots et la balise..."Robots"CONTENT="index,
Bonjour
Par destination de son objet, les robots indexent toutes les pages dés lors que les attributs spécifient "index,follow" (ou all selon).
Mais ce que je n'arrive pas à comprendre, c'est comment un robot peut justement indexer des pages "réécrites" dans un fichier .htaccess.
Ma première question :
Un robot, avant d'indexer quoique ce soit, est-il paramétré pour analyser automatiquement le contenu d'un fichier .htaccess ?
Ma seconde question:
J'aimerais savoir si certains d'entre vous ont déjà conçu des générateurs perso d'url à réécrire, notemment pour des sites pouvant générer des milliers de liens, du fait de la multitude d'articles ou variables à gérer.
Merci à vous pour vos réponses éventuelles.
Cordialement
Par destination de son objet, les robots indexent toutes les pages dés lors que les attributs spécifient "index,follow" (ou all selon).
Mais ce que je n'arrive pas à comprendre, c'est comment un robot peut justement indexer des pages "réécrites" dans un fichier .htaccess.
Ma première question :
Un robot, avant d'indexer quoique ce soit, est-il paramétré pour analyser automatiquement le contenu d'un fichier .htaccess ?
Ma seconde question:
J'aimerais savoir si certains d'entre vous ont déjà conçu des générateurs perso d'url à réécrire, notemment pour des sites pouvant générer des milliers de liens, du fait de la multitude d'articles ou variables à gérer.
Merci à vous pour vos réponses éventuelles.
Cordialement
up!
Pas de réponse pour la seconde question ?
En fait, il est posible, voire enfantin de générer des url réecrites en utilisant sql pour les créer.A condition d'avoir quelques notions bien sûr.
Mais quel gain de temps !
Nota :Il faut des jours et des jours pour élaborer un fichier .htaccess lorsq'on dispose d'une liste "infinie" de produits ou thémes.
J'ai pu générer plus de 4000 urls différentes en une demi-journée, et au demeurant en partie testées.(m'en reste 2 fois autant) arfff !
Je reste persuadé que cette solution mérite d'être développée un peu plus en profondeur, d'où ma question sur le sujet.
Pas de réponse pour la seconde question ?
En fait, il est posible, voire enfantin de générer des url réecrites en utilisant sql pour les créer.A condition d'avoir quelques notions bien sûr.
Mais quel gain de temps !
Nota :Il faut des jours et des jours pour élaborer un fichier .htaccess lorsq'on dispose d'une liste "infinie" de produits ou thémes.
J'ai pu générer plus de 4000 urls différentes en une demi-journée, et au demeurant en partie testées.(m'en reste 2 fois autant) arfff !
Je reste persuadé que cette solution mérite d'être développée un peu plus en profondeur, d'où ma question sur le sujet.
moi pas comprendre la 1ere question !?
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
julio38 a écrit:moi pas comprendre la 1ere question !?
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
Justement, la réécriture du lien "produit.php?cat=2&p=3" vers "monproduit-2-3.html" se fait dans le fichier htaccess non ?
Par conséquent, comment le crawler peut le connaitre s'il ne lit pas ce fichier ?
décidement ... je comprend pas non plus la réponse !
et tes utilisateurs ? ils font comment ?
soit ils cliquent sur un lien "produit.php?cat=2&p=3"
et dans ce cas ton url rewriting ne sert à rien
soit ils cliquent sur "monproduit-2-3.html" (et arrive sur la bonne page)
et c'est pas pour autant qu'ils ont regardé dans le htaccess !!
et tes utilisateurs ? ils font comment ?
soit ils cliquent sur un lien "produit.php?cat=2&p=3"
et dans ce cas ton url rewriting ne sert à rien
soit ils cliquent sur "monproduit-2-3.html" (et arrive sur la bonne page)
et c'est pas pour autant qu'ils ont regardé dans le htaccess !!
5 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- La balise meta NOYDIR de Yahoo
- Des informations sur l'algorithme de Yahoo Search fournies par Priyank Garg
- Sortie de GoogleStats v2.01
- Les crawlers de Yahoo!
- Comment faire ignorer des zones de page pour Yahoo (robots-nocontent)
- Lancement de Spider Simulator
- Affichage de la description DMOZ dans MSN Search
- Les robots MSNbot de Live Search
- X-Robots-Tag : directive pour bloquer les robots dans l'entête HTTP : explications
- Déclarer son fichier sitemap dans le fichier robots.txt
- <meta name="robots" content="noodp" /
- META NAME="ROBOTS" CONTENT="NOARCHIVE"
- <meta name="robots" content="noindex, foll
- name="robots" content="noindex
- meta robots content="index follow"
- Question sur la balise meta "robots"
- <meta robots> content="none" temporaire...
- balise meta http-equiv="Content-Language"
- Robots.txt : Exclure toute page sauf "telles pages"
- Ranger par thèmes|et "visuel" pour les robots/visi
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum