Goggle crawle les feuilles de styles CSS
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Albert Ier,
Tu suggères qu'une organisation comme Google n'est pas en mesure d'utiliser des proxies ou des banales adresses d'ISP pour faire certaines vérifications sur des URL qui lui ont été dénoncées comme cloakées par des spams reports ?
Ce serait un peu fort, non ?
Jean-Luc
Tu suggères qu'une organisation comme Google n'est pas en mesure d'utiliser des proxies ou des banales adresses d'ISP pour faire certaines vérifications sur des URL qui lui ont été dénoncées comme cloakées par des spams reports ?
Ce serait un peu fort, non ?
Jean-Luc
si je peux le faire, pourquoi pas Google
donc, je ne suggère rien de tel ...
c'était par amusement seulement,
et puis bon, le seul grand intérêt de coupler CSS à PHP serait la compression côté serveur, j'avais bien appuyé ce point, mais ça n'a semblé émouvoir personne
donc, je ne suggère rien de tel ...
c'était par amusement seulement,
et puis bon, le seul grand intérêt de coupler CSS à PHP serait la compression côté serveur, j'avais bien appuyé ce point, mais ça n'a semblé émouvoir personne
- Lord_Coder
- WRInaute occasionnel

- Messages: 243
- Inscription: Sam Avr 15, 2006 18:25
Salut ,
impossible
Disons que le visiteur a Konqueror ( d'où vient le Mozilla 5.0 ) et l'a configuré pour qu'il soit identifié comme GoogleBot
( c'est possible en fouillant un peu
) .
impossible
Disons que le visiteur a Konqueror ( d'où vient le Mozilla 5.0 ) et l'a configuré pour qu'il soit identifié comme GoogleBot
Lord_Coder a écrit:a configuré pour qu'il soit identifié comme GoogleBot( c'est possible en fouillant un peu
) .
c'est bien pour cette raison qu'il vaut mieux identifier des plages IP que des UA ...
le plus facile à modifier sur quel que soit le système, nav ou bot, est le UA ...
Même avec Lynx c'est très facile de spoofer son UA ... alors avec Konqueror
Bonjour,
Comment Google, s'il se comporte comme Gecko, va-t-il pouvoir continuer à alimenter son index et ses milliards de pages ? Cela va lui prendre beaucoup de temps ! Si Monsieur Google lit la feuille de styles, ira-t-il lire les feuilles de styles descendantes, si l'on décide d'utiliser @import url(); ?
Comment Google, s'il se comporte comme Gecko, va-t-il pouvoir continuer à alimenter son index et ses milliards de pages ? Cela va lui prendre beaucoup de temps ! Si Monsieur Google lit la feuille de styles, ira-t-il lire les feuilles de styles descendantes, si l'on décide d'utiliser @import url(); ?
La chose est toute nouvelle epokhe, tu peut le voir en lisant ce topic
Mais si ils décident de commencer à crawler les feuilles de style, il les lira toutes. Ce serait trop simple de camoufler du contenu en faisant des imports en cascade.
Et ils adapteront alors leur infrastructure.
Ils ont d'ailleurs déjà commencé ... -http://actu.abondance.com/2006-25/google-datacenter.php
Mais si ils décident de commencer à crawler les feuilles de style, il les lira toutes. Ce serait trop simple de camoufler du contenu en faisant des imports en cascade.
Et ils adapteront alors leur infrastructure.
Ils ont d'ailleurs déjà commencé ... -http://actu.abondance.com/2006-25/google-datacenter.php
Lord_Coder a écrit:Salut ,
impossible
Disons que le visiteur a Konqueror ( d'où vient le Mozilla 5.0 ) et l'a configuré pour qu'il soit identifié comme GoogleBot( c'est possible en fouillant un peu
) .
Mozilla5.0 vient pas de Konqueror, il vient de netscape, mis en OpenSource.
Safaris (sous OS X) et le navigateur de Nokia pour smartphone viennent de Konqueror.
Et jouer sur les UA, 'est risqué, comme tu le dis, ça se change facilement.
Juste pour info, la couverture fonctionnelle des bots "privés" est bc plus large que celle des bots "publics".
La mise en production d'une nouvelle fonctionalité correspond généralement à une "barrière" techno qui tombe.
Des fonctionalités simple à mettre en oeuvre sur des petits index ( quelques millions de pages ) deviennent problématiques sur des index de +sieurs milliards de pages.
La mise en production d'une nouvelle fonctionalité correspond généralement à une "barrière" techno qui tombe.
Des fonctionalités simple à mettre en oeuvre sur des petits index ( quelques millions de pages ) deviennent problématiques sur des index de +sieurs milliards de pages.
- Bobi La Pointe
- Nouveau WRInaute
- Messages: 46
- Inscription: Mer Juin 14, 2006 17:07
Cendrillon a écrit:... je suis convaincue que Google ne positionne plus les pages sur la vue source mais sur la vue telle que la voit les utilisateurs dans leur navigateur ...
+1 avec toi Cendrillon
Ce genre d'analyse 'visuelle' de la page peut donner des tas d'infos pertinentes sur la qualité des liens (menu pied de page ou intégré dans une info) ou même la valeur d'un titre H1 bien visible en haut plutôt que tout en bas en scrollant.
Ca doit sacrément fumer dans les calculateurs de Google...
-

Cendrillon - WRInaute accro

- Messages: 4747
- Inscription: Mar Aoû 17, 2004 15:41
spidetra a écrit:Des fonctionalités simple à mettre en oeuvre sur des petits index ( quelques millions de pages ) deviennent problématiques sur des index de +sieurs milliards de pages.
tout à fait d'accord avec toi spid, sans compter les effets de bords (qui peuvent expliquer certains retours en arrière "inexpliqués" de Google) ...
Ca doit sacrément fumer dans les calculateurs de Google...
oui, tu peux le dire, en même temps ils font ce qu'il faut pour cela ...
Cendrillon a écrit:spidetra a écrit:Des fonctionalités simple à mettre en oeuvre sur des petits index ( quelques millions de pages ) deviennent problématiques sur des index de +sieurs milliards de pages.
tout à fait d'accord avec toi spid, sans compter les effets de bords (qui peuvent expliquer certains retours en arrière "inexpliqués" de Google) ...![]()
inexpliqué.... tu veux dire totalement instable et totalement imprévisible
C'est Andrey Kolmogorov * qui doit se tordre de rire dans sa tombe.
* Andrey Kolmogorov : théorie du chaos ( en résumé ) !
Que Google tente de voir la page "comme l'utilisateur", ça semble logique et tout le monde semble d'accord. Mais jusqu'où peut il aller actuellement?
Anecdote :
J'avais de bons vieux liens en bas de page sur mes sites (pour les lier entre eux), un paragraphe simplement en bas du code. Il y a deux semaines, j'ai mis ces liens dans un calque. Dans le code, il est tout en haut, et à l'affichage il est toujours en bas de page (un grand classique quoi!). Eh bien le résultat sur les sites liés est flagrant, de +15% à +30% de visiteurs en plus depuis Google (on dirait une pub pour un SEO véreux). Donc, si la détection de ce genre d'astuce est au programme, ce n'est visiblement pas encore en action.
Que Google identifie les h1 de 8px par exemple, je veux bien le croire, c'est tellement simple à repérer. Quand à interpréter complétement l'affichage d'une page, bien sûr qu'ils en sont capable, mais à quel prix en terme de ressources? La limite est surement là.
Anecdote :
J'avais de bons vieux liens en bas de page sur mes sites (pour les lier entre eux), un paragraphe simplement en bas du code. Il y a deux semaines, j'ai mis ces liens dans un calque. Dans le code, il est tout en haut, et à l'affichage il est toujours en bas de page (un grand classique quoi!). Eh bien le résultat sur les sites liés est flagrant, de +15% à +30% de visiteurs en plus depuis Google (on dirait une pub pour un SEO véreux). Donc, si la détection de ce genre d'astuce est au programme, ce n'est visiblement pas encore en action.
Que Google identifie les h1 de 8px par exemple, je veux bien le croire, c'est tellement simple à repérer. Quand à interpréter complétement l'affichage d'une page, bien sûr qu'ils en sont capable, mais à quel prix en terme de ressources? La limite est surement là.
C'est certain que google utilise la représentation de la page via un navigateur custom.
De toute façon aujourd'hui on ne peut plus se baser sur les balises grâce/à cause des CSS.
La structure (x)HTML n'a plus vraiment lieu d'exister....
Si SPAN = H1 et DIV = B où va-t'on ?
Alors OUI il y a des DIV=hidden dans ma CSS MAIS javascript les rend visible à un moment ou un autre donc ça sert à rien de trembler.
Je pense qu'il est possible que l'indexation des css soit là pour restructurer les documents, je m'explique :
un SPAN avec font-size=28pt est peut être assimilé à un H1
non ? (après tout c'est ce qu'il est !)
Je pense qu'il y a une grosse mixture au total mais rien ne vaut du contenu journalier ET de bons liens externes/internes.
De toute façon aujourd'hui on ne peut plus se baser sur les balises grâce/à cause des CSS.
La structure (x)HTML n'a plus vraiment lieu d'exister....
Si SPAN = H1 et DIV = B où va-t'on ?
Alors OUI il y a des DIV=hidden dans ma CSS MAIS javascript les rend visible à un moment ou un autre donc ça sert à rien de trembler.
Je pense qu'il est possible que l'indexation des css soit là pour restructurer les documents, je m'explique :
un SPAN avec font-size=28pt est peut être assimilé à un H1
non ? (après tout c'est ce qu'il est !)
Je pense qu'il y a une grosse mixture au total mais rien ne vaut du contenu journalier ET de bons liens externes/internes.
A la réflexion, il est grand temps que Google se mette à lire les CSS, parce qu'il y a belle lurette qu'on peut définir soi-même ses propres balises et ne plus se contenter de noms standards - depuis fin 2001 je crois bien.
Essayez ce code, ouvrez les yeux et rêvez un peu
Essayez ce code, ouvrez les yeux et rêvez un peu
- Code: Tout sélectionner
<HTML XMLNS:sZarah>
<head>
<style type="text/css">
@media all {sZarah\:ttd {text-align:right; width:150px;float:left;}}
@media all {sZarah\:titre {text-align:left; font-size:24px;float:left;}}
</style>
</head>
<body>
<sZarah:titre>
Ne vous contentez pas de bêtes tags :)
<br>
Sortez du commun !
<br>
Créez VOS propres balises :)
</sZarah:titre>
<sZarah:ttd>
Par exemple, ce paragraphe-ci se trouve dans un élément-maison,
défini pour <B>t</B>aper <B>t</B>out à <B>d</B>roite en 150 de large ;-)
<br>
Et dire que tout ça existe depuis 2001 :)
</sZarah:ttd>
</body></html>
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Google crawle les fichiers CSS
- Nouveau service donnant le PageRank sans la Toolbar
- Comment optimiser la proéminence des mots-clés
- Découpage du forum webmaster en 2 forums
- Afficher le PageRank en entier dans Firefox (barre d'outils Google)
- Comment voir facilement les liens nofollow dans Firefox
- Prise en compte de la mise en page HTML par les moteurs de recherche
- Les blogs (Search Engine Strategies 2004 - San José)
- 25 astuces pour optimiser son blog
- Interview de Raphael Goetter sur le chat de WRI
- Les feuilles de styles peuvent elles marcher dans GMAIL ?
- Feuilles css en cache ?
- Feuilles de style css et balise H1
- Styles CSS et importance des h1
- [CSS] Formatage de liens de différents styles
- Ne pas afficher les styles CSS
- Styles CSS pour tous les navigateurs
- 2 styles CSS sur une boucle en php
- Petite erreur dans le fichier styles.css ( V 1.0.3 )
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités








le forum