Détection des bots
3 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Détection des bots
Bonjours j'aimerai détecté les bots sur mon forum, pour cela j'ai fais un petit code. Je sais pas si ca vous parrait correct :
Pensez vous que ca peut fonctionner?
- Code: Tout sélectionner
$bot ="<br> Bots sur le forum : ";
for($i=0; $i<mysql_num_rows($countinvites); $i++) {
switch (getenv("HTTP_USER_AGENT" )) {
case 'Googlebot': echo $bot.'| <b><span class="rose2">GoogleBot</span></b> | '; break;
case 'Yahoo!': echo $bot.'| <b><span class="rose2">Yahoo!</span></b> | '; break;
case 'AskJeeves': echo $bot.'| <b><span class="rose2">AskJeeves</span></b> | '; break;
case 'MSNBot': echo $bot.'| <b><span class="rose2">MSNBot</span></b> | '; break;
}
}
Pensez vous que ca peut fonctionner?
Non, car l'User Agent n'est pas Googlebot, Yahoo...
Il faut éventuellement rechercher la présence de Googlebot dans la variable d'environnement.
http://www.google.fr/search?hl=fr&q=Use ... des+robots
http://www.google.fr/search?hl=fr&q=d%C ... robots+php
Il faut éventuellement rechercher la présence de Googlebot dans la variable d'environnement.
http://www.google.fr/search?hl=fr&q=Use ... des+robots
http://www.google.fr/search?hl=fr&q=d%C ... robots+php
Re: Détection des bots
sff a écrit:Bonjours j'aimerai détecté les bots sur mon forum, pour cela j'ai fais un petit code. Je sais pas si ca vous parrait correct :
- Code: Tout sélectionner
$bot ="<br> Bots sur le forum : ";
for($i=0; $i<mysql_num_rows($countinvites); $i++) {
switch (getenv("HTTP_USER_AGENT" )) {
case 'Googlebot': echo $bot.'| <b><span class="rose2">GoogleBot</span></b> | '; break;
case 'Yahoo!': echo $bot.'| <b><span class="rose2">Yahoo!</span></b> | '; break;
case 'AskJeeves': echo $bot.'| <b><span class="rose2">AskJeeves</span></b> | '; break;
case 'MSNBot': echo $bot.'| <b><span class="rose2">MSNBot</span></b> | '; break;
}
}
Pensez vous que ca peut fonctionner?
Non... Déjà, le User-Agent n'est pas aussi court que ça, il faut que tu utilises des regexps pour voir si le user agent *contient* quelque chose qui te permet de reconnaître le robot, pas strictement égal (même en utilisant les user-agents complets tu t'exposes au problème des nouvelles versions etc.).
Ensuite la question est de savoir si tu veux identifier des robots particuliers, ou tous les robots en général. Dans le second cas, la meilleure méthode est de faire en sorte que ton robots.txt soit géré par un script dynamique qui va noter "qui" le consulte (UA et/ou IP), ensuite tu peux comparer à la liste que tu construits comme ça (via un BDD).
Dans le premier cas, ben bon courage pour recenser tout le monde!
Jacques.
3 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Sortie officielle de GoogleStats v2.0 !
- Sortie de GoogleStats v2.01
- Brevet de Google sur le contenu dupliqué
- Le système de crawl de Google en 2008
- Algorithme de détection du link spam de masse
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- La détection des blog rolls dans Google Blog Search
- Référencement : le problème des sessions des pages PHP
- Google a répertorié 1000 milliards de pages sur le web !
- Les tendances du référencement en 2009
- bots
- Bots et formulaires
- Bots Google
- Rewritting et bots
- Nouveaux Bots
- 100 bots Yahoo
- Liste des bots
- Nombre de bots en moyenne ?
- Ou sont les bots
- Redirections php et bots
- Détection du navigateur + Reroutage
- petites annonces et détection IP.
- .htaccess bloquer des bots..
- Organisation d'une course aux bots
- détection fermeture navigateur ?
- Analyse de similarité textuelle
Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués. - Test de redirection
Cet outil vous permet de tester la validité d'un lien pour le référencement. Il vous indique la nature du lien (lien en dur, redirection bien gérée par les moteurs ou redirection mal gérée par les moteurs).
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 1 invité




le forum