Robots et la balise..."Robots"CONTENT="index,
5 messages
• Page 1 sur 1
Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics
- beri
- Nouveau WRInaute

- Messages: 6
- Inscription: 1 Juin 2005
Robots et la balise..."Robots"CONTENT="index,
Bonjour
Par destination de son objet, les robots indexent toutes les pages dés lors que les attributs spécifient "index,follow" (ou all selon).
Mais ce que je n'arrive pas à comprendre, c'est comment un robot peut justement indexer des pages "réécrites" dans un fichier .htaccess.
Ma première question :
Un robot, avant d'indexer quoique ce soit, est-il paramétré pour analyser automatiquement le contenu d'un fichier .htaccess ?
Ma seconde question:
J'aimerais savoir si certains d'entre vous ont déjà conçu des générateurs perso d'url à réécrire, notemment pour des sites pouvant générer des milliers de liens, du fait de la multitude d'articles ou variables à gérer.
Merci à vous pour vos réponses éventuelles.
Cordialement
Par destination de son objet, les robots indexent toutes les pages dés lors que les attributs spécifient "index,follow" (ou all selon).
Mais ce que je n'arrive pas à comprendre, c'est comment un robot peut justement indexer des pages "réécrites" dans un fichier .htaccess.
Ma première question :
Un robot, avant d'indexer quoique ce soit, est-il paramétré pour analyser automatiquement le contenu d'un fichier .htaccess ?
Ma seconde question:
J'aimerais savoir si certains d'entre vous ont déjà conçu des générateurs perso d'url à réécrire, notemment pour des sites pouvant générer des milliers de liens, du fait de la multitude d'articles ou variables à gérer.
Merci à vous pour vos réponses éventuelles.
Cordialement
- beri
- Nouveau WRInaute

- Messages: 6
- Inscription: 1 Juin 2005
up!
Pas de réponse pour la seconde question ?
En fait, il est posible, voire enfantin de générer des url réecrites en utilisant sql pour les créer.A condition d'avoir quelques notions bien sûr.
Mais quel gain de temps !
Nota :Il faut des jours et des jours pour élaborer un fichier .htaccess lorsq'on dispose d'une liste "infinie" de produits ou thémes.
J'ai pu générer plus de 4000 urls différentes en une demi-journée, et au demeurant en partie testées.(m'en reste 2 fois autant) arfff !
Je reste persuadé que cette solution mérite d'être développée un peu plus en profondeur, d'où ma question sur le sujet.
Pas de réponse pour la seconde question ?
En fait, il est posible, voire enfantin de générer des url réecrites en utilisant sql pour les créer.A condition d'avoir quelques notions bien sûr.
Mais quel gain de temps !
Nota :Il faut des jours et des jours pour élaborer un fichier .htaccess lorsq'on dispose d'une liste "infinie" de produits ou thémes.
J'ai pu générer plus de 4000 urls différentes en une demi-journée, et au demeurant en partie testées.(m'en reste 2 fois autant) arfff !
Je reste persuadé que cette solution mérite d'être développée un peu plus en profondeur, d'où ma question sur le sujet.
-

julio38 - WRInaute discret

- Messages: 124
- Inscription: 19 Avr 2005
moi pas comprendre la 1ere question !?
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
- beri
- Nouveau WRInaute

- Messages: 6
- Inscription: 1 Juin 2005
julio38 a écrit:moi pas comprendre la 1ere question !?
le crawler se comporte comme un etre humain: il suit les liens (internes et externes)
si toutes tes urls sont réécrites : il ne connait que cette ci.
par exemple : si tu fais un lien /monproduit-2-3.html
(qui à l'origine est produit.php?cat=2&p=3 )
le crawler ne voit que /monproduit-2-3.html.
il a pas besoin de lire le htaccess et ne sait d'ailleur pas que n'est une url rewrité
Justement, la réécriture du lien "produit.php?cat=2&p=3" vers "monproduit-2-3.html" se fait dans le fichier htaccess non ?
Par conséquent, comment le crawler peut le connaitre s'il ne lit pas ce fichier ?
-

julio38 - WRInaute discret

- Messages: 124
- Inscription: 19 Avr 2005
décidement ... je comprend pas non plus la réponse !
et tes utilisateurs ? ils font comment ?
soit ils cliquent sur un lien "produit.php?cat=2&p=3"
et dans ce cas ton url rewriting ne sert à rien
soit ils cliquent sur "monproduit-2-3.html" (et arrive sur la bonne page)
et c'est pas pour autant qu'ils ont regardé dans le htaccess !!
et tes utilisateurs ? ils font comment ?
soit ils cliquent sur un lien "produit.php?cat=2&p=3"
et dans ce cas ton url rewriting ne sert à rien
soit ils cliquent sur "monproduit-2-3.html" (et arrive sur la bonne page)
et c'est pas pour autant qu'ils ont regardé dans le htaccess !!
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- délai de prise en compte du <meta name="robots" content="none" /> pour pages déjà indéxées
- URGENT : <meta name="robots" content="noindex,follow" /> et Google m'indexe mes pages !
- connaissez vous <meta name="robots" content="*" />
- <meta name="robots" content="noindex,follow"/>
- Emplacement Balises< Meta name="robots" content="" />
- <meta name="robots" content="noodp" /
- META NAME="ROBOTS" CONTENT="NOARCHIVE"
- <meta name="robots" content="noindex, foll
- name="robots" content="noindex
- meta robots content="index follow"
- l'attribut rel=nofollow contre le spam de commentaires ?
- Séminaires Google et Netlinking - 6 et 7 octobre 2004
- Optimiser le référencement d'un blog Dotclear : balises TITLE et META
- Outil : calcul de popularité sur les réseaux sociaux
- La balise meta NOYDIR de Yahoo
- Google reconnait-il les différentes formes de mots ? (singulier/pluriel et autres)
- Keyword Search Engine : le choix des bons mots-clés
- Comment indiquer une URL canonique dans l'entête HTTP
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher
- Calcul d'indice de densité
Cet outil vous permet de calculer l'indice de densité d'un mot-clé d'une page web. Il est calculé à la fois pour la balise TITLE, la balise META description et l'ensemble du texte de la page. - Détection de pages similaires
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
