PHP/ Déterminer le contenu utile d'une page Web
5 messages
• Page 1 sur 1
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
PHP/ Déterminer le contenu utile d'une page Web
Vous avez peut-être déjà croisé des projets qui, comme Majestic 12, travaillent à identifier le contenu utile HTML des pages indexées (= virer les headers, les footers, etc).
Avez-vous des informations / des idées sur les algorithmes qui peuvent être utilisés à cette fin?
Avez-vous des informations / des idées sur les algorithmes qui peuvent être utilisés à cette fin?
- Didier_S
- WRInaute impliqué

- Messages: 567
- Inscription: 24 Aoû 2004
bigjet: Pas évident... strip_tags enlève les tags, mais pas leur contenu... ici, on parle de séparer "contenu parasite" et "contenu texte"
A première vue, je pencherais pour le calcul du poids des balises par rapport au texte. Ca permet d'enlever facilement tout ce qui est nav, elements graphiques, etc (qui demandent plus de balises que le contenu texte)
A première vue, je pencherais pour le calcul du poids des balises par rapport au texte. Ca permet d'enlever facilement tout ce qui est nav, elements graphiques, etc (qui demandent plus de balises que le contenu texte)
5 messages
• Page 1 sur 1
Lectures recommandées sur ce thème :
- Site Web HTML/PHP , Disparition du contenu administrable.
- Utile ou pas utile? page.php --> Page.html ?
- est il utile d'ajouter des pages à faible contenu ?
- Mettre le contenu en premier dans une page est-ce utile ?
- Le guide web de yahoo : utile ou pas ?
- Poster Utile / Repondre Utile / Fonction recherche
- site web et contenu video
- Redirect - adresse web et contenu...
- Point de vue contenu site web
- Projet web : partage de contenu média géolocalisé
- Avoir beaucoup de contenu : conseil n°1 en référencement - 04-08-2008
- J'ai de la chance ! - 02-08-2003
- Nouveautés sur les recherches de Google Images - 22-02-2009
- Google Search-based Keyword Tool : outil de recherche de mots-clés - 24-11-2008
- Article sur le fichier .htaccess - 11-01-2003
Consultez la description détaillée des produits ou services de Google suivants : Google Base
- Tester l'indexation récente d'un site dans Google
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Calcul du taux de backlinks vers pages internes
Cet outil vous permet de calculer le taux de liens profonds vers un site web. Un lien profond est un lien qui ne pointe pas vers la page d'accueil mais au contraire vers une page interne du site. Les sites dont l'essentiel du référencement vient de leurs inscriptions dans des annuaires ont un taux de liens profonds faible ; à l'inverse, les sites de référence ont souvent un taux de liens profonds plus important, signe que leur contenu a suscité de nombreux liens spontanés.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


