Yahoo reconnait les feuilles XSLT !

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:08

Hello,

Alors ça c’est une surprise, et même une très bonne surprise, et ça demande plus d’investigation.

Suite à quelque modifications et un oubli de mise à jours quelque part dans des référence à des feuilles de transformation XSLT, j’ai eu la surprise de voir dans des logs, des erreur 404 en réponse à des requêtes de Yahoo.... sur des feuilles de transformation XSLT, auxquelles faisaient effectivement référence avant certains fichiers XML et RSS.

Il s’agit de ce type de référence qui peuvent prendre place dans des fichiers XML (ou RSS ou Atom) :
Code: Tout sélectionner
<?xml-stylesheet type="text/xsl" href="ma-feuille.xsl"?>


Donc il comprenait cette référence, et chargeait la feuille de transformation et la rafraichissait dans son indexe. Je ne soupçonnais même pas ça, et cette erreur 404 qui me l’a fait découvrir (voilà qui est bien plus intelligent et bien plus pertinent que d’indexer des binaires ou des redirections 302 comme le fait Google).

C’est prometteur, et ça en fait carrément un robot dans l’air du temps :D

Je me demande.... Il faudrait que je fasse quelques expériences un de ces jours, pour voir s’il indexe les contenus après transformations ou seulement avant. J’y penserai plus tard.

Mais de la part du moteur (et de l’équipe qui est derrière) qui a inventé un truc aussi ingénieux que la classe “robots-nocontent” (que Google tarde toujours a adopter), ça ne m’étonnerait pas.

Au passage, c’est toujours aussi bien venu chez Speedy avec Yahoo : fichiers ajoutés à un site, indexés par Yahoo une heure plus tard à peine.... je connais un autre moteur qui peut se planquer avec ça :wink:


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 4024
Enregistré le: 14 Sep 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:13

A bon google il indexe en secondes lui. :d


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:17

YoyoS a écrit:A bon google il indexe en secondes lui. :d

Le sujet c’était surtout l’indexation et la compréhension des feuilles XSLT par Yahoo :wink:

Ça ne t’épate pas plus que ça ? :D

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 11:54

moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 13:12

aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML

XSLT, c’est de la transformation, pas de la mise en forme (la mise en forme, c’est XSL-FO ou CSS).

Un document non mis en forme, peut toujours être interprétable (on peut toujours lire un document HTML brut par exemple). Une source de document ou de données non-transformée, peut par contre être non-interprétable ou ne pas contenir la même information.

D’où l’événement que j’y vois.

Rod la Kox
WRInaute accro
WRInaute accro
 
Messages: 3249
Enregistré le: 24 Juin 2008

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 14:02

hibou57 a écrit:
YoyoS a écrit:A bon google il indexe en secondes lui. :d

Le sujet c’était surtout l’indexation et la compréhension des feuilles XSLT par Yahoo :wink:

Ça ne t’épate pas plus que ça ? :D


C'est surtout la preuve que y a toujours 2 ou 3 techniciens qui travaillent au milieu des centaines de commerciaux. :mrgreen:

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 19:44

hibou57 a écrit:
aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML

XSLT, c’est de la transformation, pas de la mise en forme (la mise en forme, c’est XSL-FO ou CSS).

Un document non mis en forme, peut toujours être interprétable (on peut toujours lire un document HTML brut par exemple). Une source de document ou de données non-transformée, peut par contre être non-interprétable ou ne pas contenir la même information.

D’où l’événement que j’y vois.



les données sont dans le XML et le XML est "human readable" , la transformation XSL n'ajoute pas de la donnée (par donnée j'entend donnée pertinente et pas un entête générique ou un truc du genre) ... donc pour un moteur de recherche je n'y vois qu'un intérêt mineur


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 22:22

aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...
pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML
+1
quel est l'intérêt pour toi qu'un internaute arrive directement sur ta page xslt ? absolument aucun si tu n'as pas de site de développement.
y! est le champion du monde de l'indexation de fichiers (ou répertoire) dont on ne lui a jamais demandé de faire l'indexation : fichiers css, racine de répertoires d'arborescence, qui n'existent pas, du genre example.com/download/file1 hé bien y! va tenter de trouver le contenu de example.com/download/ alors qu'aucun lien n'existe dessus et qu'on interdit l'affichage du contenu voire qu'on renvoie à la racine, comme un vulgaire scriptkiddie :twisted:
Quand on bloque une page spécifique, avec code 410, voire 401, qu'on demande à y! de le supprimer de son index, il faut attendre plus d'une année pour ça.
Donc comme nombre de ses concurrents (exalead chez nous), y! ferait mieux de s'atteler à améliorer son index plutôt que de travailler sur les fioritures.
En plus, sur certains nouveaux sites, il arrive largement plus vite que gg pour crawler les 1° pages (genre - d'1 h), mais il faut attendre plusieurs jours ou semaines pour que le site apparaisse dans ses serp, alors que gg ne viendra que 4-5h plus tard, mais en 6-8 heures le nouveau site apparait


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 22:51

Leonick a écrit:quel est l'intérêt pour toi qu'un internaute arrive directement sur ta page xslt ? absolument aucun si tu n'as pas de site de développement.
[...]

Le XSLT n’est pas le document, c’est ce qui sert à produire la document à partir du XML, qui n’est pas toujours interprétable.

Pour répondre aux deux remarques à ce sujet : XSLT ce n’est pas de la présentation, c’est la de la Transformation : XSL Transformations.

Exemple : un fichier XML contient des relevés d’humidité de l’air à des instants standards, fixés par tel ou tel norme, et ou défini par tel ou tel modèle spécifique à tel ou tel organisation ou entreprise. Le fichier XML n’a aucun sens sans transformation préalable destiné à le rendre humainement lisible, parce qu’il faudrait sinon connaitre son modèle ou le standard sur lequel il repose, l’étudier, ce qui peut être long, avant de pouvoir l’interpréter : XML n’est pas HTML ! (ni même XHTML qui n’est que du HTML déguisé en XML)

Exemple :
Code: Tout sélectionner
<?xml version="1.1" encoding="UTF-8" standalone="yes" ?>
<?xml-stylesheet type="text/xsl" href="to-human-readable.xsl"?>
<datas>
   <time index="1">Blabla</time>
   <time index="2">Blabla</time>
   <time index="3">Blabla</time>
   <time index="4">Blabla</time>
   <!-- etc ... -->
</datas>


Quel sens cela fait-il d’indexer un tel fichier ? Aucun pour quelqu’un qui ne connais ni le standard ni le modèle sur lequel repose le fichier... et s’il faut connaitre tous les standards qui peuvent exister, bonjour la fête, et qu’en dire pour les moteurs de recherche.

Alors que si la feuille XSL qui peut ajouter des titres, des explications sur les unités, des références, des combinaisons avec d’autres sources, etc, n’est pas indexée et appliquée, ça n’a aucun sens.


Un autre exemple tiré de mon cas : dans mes documents source (mais qui ne sont pas diffusé sous leur forme XML), j’ai par exemple des balise “<next/>” : comment interpréter ça sans transformation ? Impossible, parce que cette balise à un sens qui est de représenter un lien vers une page suivante, et cette page suivante est déterminée par rapport à la position de la page courante dans un certain index externe qui peut être modifié indépendamment.

Donc indexer du XML sans interpréter le XSL si celui-ci est fourni, ça fait à peut prêt autant de sens que d’indexer des fichiers binaires.

En d’autres mots, le XSLT fait une forme d’interprétation [*]


[*] Elle peut aussi être destinée à produire quelque chose qui n’est pas nécessaire plus humainement lisible, comme un filtrage (juste un exemple), mais dans ce cas, il y a peu de chances que de tels fichiers soit mis à disposition des moteurs (sauf peut-être ceux qui arrivent toujours à se débrouiller pour engorger leur indexe de n’importe quoi)

--------------------------------------------------------------------------------------------------------------------

Image

Je souligne “The source tree can be filtered and reordered, and arbitrary structure and generated content can be added”.

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:19

Je pense que tu confond certaines choses.
Un moteur de recherche pour indexer et évaluer la valeur de ta page correctement la nettoie : il supprime les entêtes et pieds de pages communs aux autres pages, supprime les redondances (textes fixe sur toutes les pages) ...etc pour "isoler" le vrai contenu. Cette phase est indispensable pour tous les moteurs de recherches avant de calculer les poids en mots clés par exemple.
Les données du fichier XML brut c'est le bonheur pour un moteur de recherche, pas de superflux, que des données .

Quelque soit le moteur de recherche, il est capable d'appliquer une transformation XML/XSLT en interne, mais celà n'explique en rien l'utilité d'indexer le template XSL.


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:34

aladdin a écrit:Je pense que tu confond certaines choses.
Un moteur de recherche pour indexer et évaluer la valeur de ta page correctement la nettoie : il supprime les entêtes et pieds de pages communs aux autres pages, supprime les redondances (textes fixe sur toutes les pages) ...etc pour "isoler" le vrai contenu. Cette phase est indispensable pour tous les moteurs de recherches avant de calculer les poids en mots clés par exemple.
[...]

Et la donnée par exemple d’un élément correspondant à la pression atmosphérique juste avant l’orage de tel jour, comment il fait pour répondre à une requête correspondante de l’internaute s’il n’a pas appliqué la transformation qui aura put lui fourni le document sous une forme ou les titres « Pression atmosphérique » ainsi que les dates et d’autres choses auront été ajouté ?

Tu as vu ce que j’ai souligné en bas dans le précédent message ?

La transformation ajoute ce qui est nécessaire pour rendre le document interprétable dans un certain contexte (ici, pour ce qui nous intéresse, le contexte humain en dehors de toute connaissance sur le format du document XML en question). Autre exemple en plus du précédent que j’ai donné : dans mes sources, les liens n’ont pas d’ancre et ne contiennent que des références, les ancres sont générées lors de la transformation en récupérant automatiquement l’élément qui correspond au titre dans le fichier XML cible. Comment un moteur de recherche peut-il récupérer cela sans appliquer la transformation ? Il ne le peut pas....


Au moins Yahoo se donne les moyens de rendre interprétable ce qu’il indexe.


-- EDIT -- Sinon, à propos de la différence entre présentation et transformation et entre XSLT et XSL-FO, voici un très bon résumé, et surtout exact, à la fin de ce fil d’un forum in English : XSL-FO vs CSS... sources aimablement procurée par Exalead via la recherche CSS vs XSL sur Exalead.

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:52

La transformation dont tu parle peu très bien se faire par n'importe quel moteur, sans avoir besoins d'indexer le template XSL.

sinon pour XSL et ses variantes, je connais très très bien le sujet, je ne fais que ca à longeure de journée et j'ai publié un article sur linux+ magazine en rapport avec le sujet ...


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 0:25

aladdin a écrit:La transformation dont tu parle peu très bien se faire par n'importe quel moteur, sans avoir besoins d'indexer le template XSL. [...]

Comment ? Un exemple pour le démontrer ? (le contraire, lui, est démontré plus haut)

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 9:36

Je parle de traitement en interne, pense tu que les autre moteurs ne savent pas qu'il existe Ft.Xml.Xslt dans python ou encore domxml en PHP ?

tous les languages compilé et interprété savent faire de la transformation XSLT, ce qui implique que tous les moteurs savent le faire si necessaire.

ce dont je ne vois pas l'utilité, c'est *l'indexation des XSL* !!

vois tu une utilité à indexer du CSS toi ?
et vient pas me dire que XSL ce n'est pas du style,
XSL = XML Stylesheet Language
CSS = Cascading Style Sheets ...

les deux ont le même objectif, XSL est plus évolué c'est tout


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 11:49

ce que tu as du mal à comprendre, c'est que dans ton doc xml, tu auras fait le lien vers ton xslt, pas le contraire.
Ensuite, s'il n'y a qu'une seule transformation effectuée, j'ai du mal à voir l'intérêt d'envoyer ça à un internaute, autant lui envoyer directement le fichier transformé en html, en plus, ça posera moins de problème pour l'internaute, genre qui navigue sur son téléphone.
si c'est juste faire du xml+xslt pour en faire :roll:


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1323
Enregistré le: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 18:34

Quelle mauvaise fois dès qu’un moteur autre que Google (heuuu... je veux dire Dieu Tout Puissant) fait mieux que lui :roll:

Et les caches, ça sert à quoi à votre avis ? Pas aussi à économiser le trafic ? Donc vous suggérez qu’il devrait indexer le document, mais pas le XSLT qu’il ne mettrait donc pas en cache et qu’il serait obligé de récupérer même s’il n’a pas changé chaque fois que le document est mis à jour ?

En résumé, vous trouvez normal que Google indexe n’importe quoi, et vous trouvez anormal que Yahoo indexe des XSLT ? Il n’y a pas comme un truc qui cloche ?

aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Enregistré le: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 20:16

bah non justement, google n'est pas parfait non plus mais la réalité actuelle du marché est telle que google EST le meilleur moteur de recherche.

maintenant on peut reprocher beaucoup de choses plus graves à google, notamment sa politique de plus en plus intrusive dans la vie privée, son OS Andoid avec ces mises à jours toutes les semaines empêchant les fabricant de rester stable sur un modèle sans prendre le risque d'être très vite dépassé, ces flops comme google buzz ou orkut ... bref, il y a des choses à dires

sauf que niveau recherche, désolé mais google le moteur reste le meilleur.


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 21:52

la question que je posais c'est plutôt : quel est l'intérêt pour l'internaute que tu mettes en ligne un combo xml/xslt si ce n'est pas pour fournir plusieurs tri différents.
Ne pas oublier que le temps de chargement d'une page web, c'est entre le clic sur un lien et le navigateur rendu opérationnel (js, xslt, css, flash, etc... chargés et exécutés). Donc quel intérêt de redemander à chaque internaute de refaire l'extraction de données sur son propre pc, alors qu'en html et avec du cache, c'est fait 1 fois pour toute sur le serveur ?

J'ai quasiment aucun problème d'url indexée non désirée avec gg, il suffit de lui renvoyer les bon code 404 ou 410 et ça passe. Pour bing et y! c'est autre chose. Et je ne parle même pas des ___slurp404____ générés en très grand nombre par y! :twisted:

Tant que les concurrents de gg continueront de travailler sur les fioritures au lieu de travailler sur le coeur de métier d'un moteur (la qualité et la fraicheur de son index) ils ne pourront récupérer que des miettes.
Après, faut arrêter de se voiler la face : ça serait bien que gg ait des (vrais) concurrents, mais pour l'instant, en dehors de ma casquette webmaster, quand je fais une recherche sur internet, c'est sur gg par sur les autres (ou alors devant le manque de pertinence, je reviens vite fait sur gg)


Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :