Yahoo reconnait les feuilles XSLT !

Consultez la formation au REFERENCEMENT naturel Google de WebRankInfo / Ranking Metrics


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:08

Hello,

Alors ça c’est une surprise, et même une très bonne surprise, et ça demande plus d’investigation.

Suite à quelque modifications et un oubli de mise à jours quelque part dans des référence à des feuilles de transformation XSLT, j’ai eu la surprise de voir dans des logs, des erreur 404 en réponse à des requêtes de Yahoo.... sur des feuilles de transformation XSLT, auxquelles faisaient effectivement référence avant certains fichiers XML et RSS.

Il s’agit de ce type de référence qui peuvent prendre place dans des fichiers XML (ou RSS ou Atom) :
Code: Tout sélectionner
<?xml-stylesheet type="text/xsl" href="ma-feuille.xsl"?>


Donc il comprenait cette référence, et chargeait la feuille de transformation et la rafraichissait dans son indexe. Je ne soupçonnais même pas ça, et cette erreur 404 qui me l’a fait découvrir (voilà qui est bien plus intelligent et bien plus pertinent que d’indexer des binaires ou des redirections 302 comme le fait Google).

C’est prometteur, et ça en fait carrément un robot dans l’air du temps :D

Je me demande.... Il faudrait que je fasse quelques expériences un de ces jours, pour voir s’il indexe les contenus après transformations ou seulement avant. J’y penserai plus tard.

Mais de la part du moteur (et de l’équipe qui est derrière) qui a inventé un truc aussi ingénieux que la classe “robots-nocontent” (que Google tarde toujours a adopter), ça ne m’étonnerait pas.

Au passage, c’est toujours aussi bien venu chez Speedy avec Yahoo : fichiers ajoutés à un site, indexés par Yahoo une heure plus tard à peine.... je connais un autre moteur qui peut se planquer avec ça :wink:


YoyoS
WRInaute accro
WRInaute accro
 
Messages: 3835
Inscription: 14 Sep 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:13

A bon google il indexe en secondes lui. :d


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 9:17

YoyoS a écrit:A bon google il indexe en secondes lui. :d

Le sujet c’était surtout l’indexation et la compréhension des feuilles XSLT par Yahoo :wink:

Ça ne t’épate pas plus que ça ? :D


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Inscription: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 11:54

moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 13:12

aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML

XSLT, c’est de la transformation, pas de la mise en forme (la mise en forme, c’est XSL-FO ou CSS).

Un document non mis en forme, peut toujours être interprétable (on peut toujours lire un document HTML brut par exemple). Une source de document ou de données non-transformée, peut par contre être non-interprétable ou ne pas contenir la même information.

D’où l’événement que j’y vois.

Rod la Kox
WRInaute accro
WRInaute accro
 
Messages: 3253
Inscription: 24 Juin 2008

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 14:02

hibou57 a écrit:
YoyoS a écrit:A bon google il indexe en secondes lui. :d

Le sujet c’était surtout l’indexation et la compréhension des feuilles XSLT par Yahoo :wink:

Ça ne t’épate pas plus que ça ? :D


C'est surtout la preuve que y a toujours 2 ou 3 techniciens qui travaillent au milieu des centaines de commerciaux. :mrgreen:


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Inscription: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Sam Juil 10, 2010 19:44

hibou57 a écrit:
aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...

pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML

XSLT, c’est de la transformation, pas de la mise en forme (la mise en forme, c’est XSL-FO ou CSS).

Un document non mis en forme, peut toujours être interprétable (on peut toujours lire un document HTML brut par exemple). Une source de document ou de données non-transformée, peut par contre être non-interprétable ou ne pas contenir la même information.

D’où l’événement que j’y vois.



les données sont dans le XML et le XML est "human readable" , la transformation XSL n'ajoute pas de la donnée (par donnée j'entend donnée pertinente et pas un entête générique ou un truc du genre) ... donc pour un moteur de recherche je n'y vois qu'un intérêt mineur


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19599
Inscription: 8 Aoû 2004

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 22:22

aladdin a écrit:moui, sachant que le XSL c'est de la mise en forme je ne vois pas l'interet ... c'est comme si tu disait : youpi yahoo sait indexer du CSS ...
pour un moteur de recherche l'essentiel c'est le contenu donc dans ton cas le XML
+1
quel est l'intérêt pour toi qu'un internaute arrive directement sur ta page xslt ? absolument aucun si tu n'as pas de site de développement.
y! est le champion du monde de l'indexation de fichiers (ou répertoire) dont on ne lui a jamais demandé de faire l'indexation : fichiers css, racine de répertoires d'arborescence, qui n'existent pas, du genre example.com/download/file1 hé bien y! va tenter de trouver le contenu de example.com/download/ alors qu'aucun lien n'existe dessus et qu'on interdit l'affichage du contenu voire qu'on renvoie à la racine, comme un vulgaire scriptkiddie :twisted:
Quand on bloque une page spécifique, avec code 410, voire 401, qu'on demande à y! de le supprimer de son index, il faut attendre plus d'une année pour ça.
Donc comme nombre de ses concurrents (exalead chez nous), y! ferait mieux de s'atteler à améliorer son index plutôt que de travailler sur les fioritures.
En plus, sur certains nouveaux sites, il arrive largement plus vite que gg pour crawler les 1° pages (genre - d'1 h), mais il faut attendre plusieurs jours ou semaines pour que le site apparaisse dans ses serp, alors que gg ne viendra que 4-5h plus tard, mais en 6-8 heures le nouveau site apparait


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 22:51

Leonick a écrit:quel est l'intérêt pour toi qu'un internaute arrive directement sur ta page xslt ? absolument aucun si tu n'as pas de site de développement.
[...]

Le XSLT n’est pas le document, c’est ce qui sert à produire la document à partir du XML, qui n’est pas toujours interprétable.

Pour répondre aux deux remarques à ce sujet : XSLT ce n’est pas de la présentation, c’est la de la Transformation : XSL Transformations.

Exemple : un fichier XML contient des relevés d’humidité de l’air à des instants standards, fixés par tel ou tel norme, et ou défini par tel ou tel modèle spécifique à tel ou tel organisation ou entreprise. Le fichier XML n’a aucun sens sans transformation préalable destiné à le rendre humainement lisible, parce qu’il faudrait sinon connaitre son modèle ou le standard sur lequel il repose, l’étudier, ce qui peut être long, avant de pouvoir l’interpréter : XML n’est pas HTML ! (ni même XHTML qui n’est que du HTML déguisé en XML)

Exemple :
Code: Tout sélectionner
<?xml version="1.1" encoding="UTF-8" standalone="yes" ?>
<?xml-stylesheet type="text/xsl" href="to-human-readable.xsl"?>
<datas>
   <time index="1">Blabla</time>
   <time index="2">Blabla</time>
   <time index="3">Blabla</time>
   <time index="4">Blabla</time>
   <!-- etc ... -->
</datas>


Quel sens cela fait-il d’indexer un tel fichier ? Aucun pour quelqu’un qui ne connais ni le standard ni le modèle sur lequel repose le fichier... et s’il faut connaitre tous les standards qui peuvent exister, bonjour la fête, et qu’en dire pour les moteurs de recherche.

Alors que si la feuille XSL qui peut ajouter des titres, des explications sur les unités, des références, des combinaisons avec d’autres sources, etc, n’est pas indexée et appliquée, ça n’a aucun sens.


Un autre exemple tiré de mon cas : dans mes documents source (mais qui ne sont pas diffusé sous leur forme XML), j’ai par exemple des balise “<next/>” : comment interpréter ça sans transformation ? Impossible, parce que cette balise à un sens qui est de représenter un lien vers une page suivante, et cette page suivante est déterminée par rapport à la position de la page courante dans un certain index externe qui peut être modifié indépendamment.

Donc indexer du XML sans interpréter le XSL si celui-ci est fourni, ça fait à peut prêt autant de sens que d’indexer des fichiers binaires.

En d’autres mots, le XSLT fait une forme d’interprétation [*]


[*] Elle peut aussi être destinée à produire quelque chose qui n’est pas nécessaire plus humainement lisible, comme un filtrage (juste un exemple), mais dans ce cas, il y a peu de chances que de tels fichiers soit mis à disposition des moteurs (sauf peut-être ceux qui arrivent toujours à se débrouiller pour engorger leur indexe de n’importe quoi)

--------------------------------------------------------------------------------------------------------------------

Image

Je souligne “The source tree can be filtered and reordered, and arbitrary structure and generated content can be added”.


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Inscription: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:19

Je pense que tu confond certaines choses.
Un moteur de recherche pour indexer et évaluer la valeur de ta page correctement la nettoie : il supprime les entêtes et pieds de pages communs aux autres pages, supprime les redondances (textes fixe sur toutes les pages) ...etc pour "isoler" le vrai contenu. Cette phase est indispensable pour tous les moteurs de recherches avant de calculer les poids en mots clés par exemple.
Les données du fichier XML brut c'est le bonheur pour un moteur de recherche, pas de superflux, que des données .

Quelque soit le moteur de recherche, il est capable d'appliquer une transformation XML/XSLT en interne, mais celà n'explique en rien l'utilité d'indexer le template XSL.


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:34

aladdin a écrit:Je pense que tu confond certaines choses.
Un moteur de recherche pour indexer et évaluer la valeur de ta page correctement la nettoie : il supprime les entêtes et pieds de pages communs aux autres pages, supprime les redondances (textes fixe sur toutes les pages) ...etc pour "isoler" le vrai contenu. Cette phase est indispensable pour tous les moteurs de recherches avant de calculer les poids en mots clés par exemple.
[...]

Et la donnée par exemple d’un élément correspondant à la pression atmosphérique juste avant l’orage de tel jour, comment il fait pour répondre à une requête correspondante de l’internaute s’il n’a pas appliqué la transformation qui aura put lui fourni le document sous une forme ou les titres « Pression atmosphérique » ainsi que les dates et d’autres choses auront été ajouté ?

Tu as vu ce que j’ai souligné en bas dans le précédent message ?

La transformation ajoute ce qui est nécessaire pour rendre le document interprétable dans un certain contexte (ici, pour ce qui nous intéresse, le contexte humain en dehors de toute connaissance sur le format du document XML en question). Autre exemple en plus du précédent que j’ai donné : dans mes sources, les liens n’ont pas d’ancre et ne contiennent que des références, les ancres sont générées lors de la transformation en récupérant automatiquement l’élément qui correspond au titre dans le fichier XML cible. Comment un moteur de recherche peut-il récupérer cela sans appliquer la transformation ? Il ne le peut pas....


Au moins Yahoo se donne les moyens de rendre interprétable ce qu’il indexe.


-- EDIT -- Sinon, à propos de la différence entre présentation et transformation et entre XSLT et XSL-FO, voici un très bon résumé, et surtout exact, à la fin de ce fil d’un forum in English : XSL-FO vs CSS... sources aimablement procurée par Exalead via la recherche CSS vs XSL sur Exalead.


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Inscription: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Dim Juil 11, 2010 23:52

La transformation dont tu parle peu très bien se faire par n'importe quel moteur, sans avoir besoins d'indexer le template XSL.

sinon pour XSL et ses variantes, je connais très très bien le sujet, je ne fais que ca à longeure de journée et j'ai publié un article sur linux+ magazine en rapport avec le sujet ...


hibou57
WRInaute passionné
WRInaute passionné
 
Messages: 1154
Inscription: 1 Nov 2006

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 0:25

aladdin a écrit:La transformation dont tu parle peu très bien se faire par n'importe quel moteur, sans avoir besoins d'indexer le template XSL. [...]

Comment ? Un exemple pour le démontrer ? (le contraire, lui, est démontré plus haut)


aladdin
WRInaute passionné
WRInaute passionné
 
Messages: 1457
Inscription: 29 Avr 2005

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 9:36

Je parle de traitement en interne, pense tu que les autre moteurs ne savent pas qu'il existe Ft.Xml.Xslt dans python ou encore domxml en PHP ?

tous les languages compilé et interprété savent faire de la transformation XSLT, ce qui implique que tous les moteurs savent le faire si necessaire.

ce dont je ne vois pas l'utilité, c'est *l'indexation des XSL* !!

vois tu une utilité à indexer du CSS toi ?
et vient pas me dire que XSL ce n'est pas du style,
XSL = XML Stylesheet Language
CSS = Cascading Style Sheets ...

les deux ont le même objectif, XSL est plus évolué c'est tout


Leonick
WRInaute accro
WRInaute accro
 
Messages: 19599
Inscription: 8 Aoû 2004

Re: Yahoo reconnait les feuilles XSLT !

Message le Lun Juil 12, 2010 11:49

ce que tu as du mal à comprendre, c'est que dans ton doc xml, tu auras fait le lien vers ton xslt, pas le contraire.
Ensuite, s'il n'y a qu'une seule transformation effectuée, j'ai du mal à voir l'intérêt d'envoyer ça à un internaute, autant lui envoyer directement le fichier transformé en html, en plus, ça posera moins de problème pour l'internaute, genre qui navigue sur son téléphone.
si c'est juste faire du xml+xslt pour en faire :roll:

Yahoo reconnait les feuilles XSLT !

Si vous avez aimé cette discussion, partagez-la sur vos réseaux sociaux préférés :

Formation recommandée sur ce thème :

Formation REFERENCEMENT naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités