Robot spider de Pages Jaunes

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics


oli004
WRInaute accro
WRInaute accro
 
Messages: 2162
Inscription: Mer Jan 05, 2005 23:53

Robot spider de Pages Jaunes

Message le Mer Déc 13, 2006 19:06

Je viens par hasard en consultant mes stats de tomber sur un spider bien gourmant. Je ne le connaissais pas mais peut-être est-ce assez recent.
Au cas ou vous souhaiteriez ajouter ses infos à vos listes de spider repertoriés, voici ce que j'ai pu relever :



Connecting to whois.arin.net...

Deferred to specific whois server: whois.ripe.net...

% This is the RIPE Whois query server #1.
% The objects are in RPSL format.
%
% Note: the default output of the RIPE Whois server
% is changed. Your tools may need to be adjusted. See
% http://www.ripe.net/db/news/abuse-propo ... 50331.html
% for more details.
%
% Rights restricted by copyright.
% See http://www.ripe.net/db/copyright.html

% Note: This output has been filtered.
% To receive output for a database update, use the "-B" flag.

% Information related to '193.252.242.0 - 193.252.243.255'

inetnum: 193.252.242.0 - 193.252.243.255
netname: RPJ-PAGESJAUNES
descr: Reseau Pages Jaunes Annuaires FT
country: FR
admin-c: PJA5-RIPE
tech-c: PJA5-RIPE
status: ASSIGNED PA
mnt-by: FT-BRX
source: RIPE # Filtered

role: Pages Jaunes AEL-DT
address: Pages Jaunes
address: 125 Bd Albert 1er
address: 35207 RENNES
address: FR
e-mail: dns@pagesjaunes.fr
admin-c: PM10708-RIPE
tech-c: JB2449-RIPE
tech-c: BR5679-RIPE
tech-c: HD5414-RIPE
nic-hdl: PJA5-RIPE
mnt-by: FT-BRX
source: RIPE # Filtered

% Information related to '193.252.242.0/23AS3215'

route: 193.252.242.0/23
descr: France Telecom
descr: RPJ-PAGESJAUNES
descr: Reseau Pages Jaunes Annuaires FT
origin: AS3215
mnt-by: FT-BRX
source: RIPE # Filtered





Leonick
WRInaute accro
WRInaute accro
 
Messages: 12167
Inscription: Dim Aoû 08, 2004 20:24

Message le Mer Déc 13, 2006 21:45

il envoie quels referers ?


TOMHTML
WRInaute accro
WRInaute accro
 
Messages: 3242
Inscription: Mer Aoû 25, 2004 14:05

Message le Mer Déc 13, 2006 22:23

Je reçois toujours une visite de celui là
Code: Tout sélectionner
FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)

qui s'amuse à chercher des répertoires qui n'existent pas...


Monty973
WRInaute accro
WRInaute accro
 
Messages: 1614
Inscription: Mar Mar 21, 2006 4:52

Message le Mer Déc 13, 2006 22:25

TOMHTML a écrit:Je reçois toujours une visite de celui là
Code: Tout sélectionner
FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)

qui s'amuse à chercher des répertoires qui n'existent pas...


Pareil, ce qui m'a étonné, c'est que le crawler des pages jaune ait une adresse gmail...


Leonick
WRInaute accro
WRInaute accro
 
Messages: 12167
Inscription: Dim Aoû 08, 2004 20:24

Message le Mer Déc 13, 2006 22:32

Effectivement, je me souviens maintenant, il est passé assez rarement et je m'étais fait la même remarque sur l'adresse mel.


nickargall
WRInaute accro
WRInaute accro
 
Messages: 5295
Inscription: Lun Juin 13, 2005 14:13

Message le Jeu Déc 14, 2006 10:09

Monty973 a écrit:Pareil, ce qui m'a étonné, c'est que le crawler des pages jaune ait une adresse gmail...


Un signe de plus du rachat des Pages Jaunes par Google ? ;)


oli004
WRInaute accro
WRInaute accro
 
Messages: 2162
Inscription: Mer Jan 05, 2005 23:53

Message le Jeu Déc 14, 2006 10:57

Leonick a écrit:il envoie quels referers ?


Host : Non mentionné.
OS : spider
Browser : ?
Reso : N/A


keroin
WRInaute accro
WRInaute accro
 
Messages: 2299
Inscription: Sam Avr 29, 2006 16:33

Message le Jeu Déc 14, 2006 11:09

Oui chez moi aussi il s'éclate comme un dingue sur chacun de mes sites depuis 3 jours => 1000 visites/jours environ pour chaque site 8O

Pour le referer, c'est le même

User agent ou IP => FAST Enterprise Crawler 6 used by Pages Jaunes (crawladmin@gmail.com)
Utilisateur => Pages Jaunes


oli004
WRInaute accro
WRInaute accro
 
Messages: 2162
Inscription: Mer Jan 05, 2005 23:53

Message le Jeu Déc 14, 2006 11:43

Faut-il y voir un rapport avec ceci :



Lancement officiel du nouveau moteur de recherche PagesJaunes.ca

La version bêta du nouveau site PagesJaunes.caMC bien reçue par les utilisateurs et les annonceurs

Montréal (Québec), le 5 septembre 2006 – Après le succès remporté par la version bêta lancée le 20 juin dernier, Groupe Pages Jaunes (GPJ) lance maintenant officiellement son nouveau moteur de recherche PagesJaunes.caMC. Le site tient compte des commentaires de près de 15 000 utilisateurs qui ont essayé la version bêta. Les utilisateurs ont évalué à 4,6 sur 5 leur impression générale du site et à 4,7 sur 5 la facilité d’utilisation. Avec de tels résultats, GPJ est fière de donner maintenant aux Canadiens un accès direct à sa nouvelle plateforme au www.PagesJaunes.ca.


....... suite de l'article sur leur site




:roll:


MagicYoyo
WRInaute accro
WRInaute accro
 
Messages: 2509
Inscription: Lun Mai 24, 2004 15:33

Message le Jeu Déc 14, 2006 11:59

FAST est l'entreprise norvégienne qui édite Alltheweb, rachetée (je crois) par Yahoo et qui fournit les résultats moteurs Yahoo!


dauzac
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 149
Inscription: Mar Avr 08, 2003 16:08

Message le Jeu Déc 14, 2006 13:32

keroin a écrit :
Oui chez moi aussi il s'éclate comme un dingue ...

... et chez moi aussi.

Je viens de faire une petite recherche avec www.PagesJaunes.ca mais la recherche aboutit sur une erreur 404. Vraiment Bêta la version :wink:

A+


Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et surtout comment en obtenir. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :

Consultez la description détaillée des produits ou services de Google suivants : Googlebot, Google Feed Fetcher

  • Analyse de similarité textuelle
    Cet outil vous permet de calculer la similarité entre 2 pages web. L'algorithme utilisé repose sur l'analyse des occurrences des mots (mais pas sur leur positionnement dans les pages). Google utilise cette notion à certains endroits dans son algorithme, mais de façon bien plus évoluée que ce petit outil... Avoir des pages trop similaires peut entraîner des problèmes d'indexation... Cet outil vous permettra peut-être de résoudre certains problèmes de contenus dupliqués.
  • Calcul du taux de liens profonds
    Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités