Moteur de sites dédié à la finance

Consultez la formation sur les stratégies de liens de WebRankInfo / Ranking Metrics


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Moteur de sites dédié à la finance

Message le Ven Aoû 17, 2012 22:18

même pas, car souvent, si tu ne trouves pas, presque immédiatement, dans la page d'arrivée, ce que tu cherchais, tu repars dans les serp, alors que si tu trouves, tu vas peut-être suivre les liens des sujets connexes (et donc voir plus de pages)

Annonces Google


yule
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 283
Enregistré le: 23 Juil 2004

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 7:37

HEllo,

Passablement de bonne idées dans vos derniers messages ! Effectivement il y a beaucoup à faire et pleins de soluces peuvent y être adaptées.. après faut avoir le temps et les connaissances.. ca c'est autre chose ;-)

POur le fait de crawler plus en profondeur ou au moins une page en plus me plaît, simplement le crawl est lourd en ressource, faut que je regarde cette partie et que j'analyse ce que je peux faire.. par contre crawler par défaut x pages seraient plus "casse-gueule" car je ne suis pas certain que toutes les pages d'un sites soumis concerne que la finance.

Après il y aurait aussi le fait d'indexer les flux rss pour les utiliser dans la recherche, pour le moment, je ne fais qu'afficher 5 items... eh bon tu es presque obliger de crawler régulièrement voir toutes les 10min pour un flux... argh...

Enfin il y a de quoi faire, tu peux même faire une grosse alternative entre les gros moteurs et les bons annuaires.. mais la c'est plus un truc de pro..
A+
Yule


zeb
WRInaute accro
WRInaute accro
 
Messages: 13572
Enregistré le: 5 Déc 2004

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 11:00

yule a écrit:le crawl est lourd en ressource

Il faudrait des détails sur la techno que tu utilise pour cela car si crawler plus de page représente un souci en l'état, il faut déjà se dire qu'un annuaire bien garni présentera le même souci (plus tard) même si il ne prend en compte qu'une page. Mais il y a tjs des solutions ...
Dans le cas présent il me semble que penser "cluster" serait pas forcement idiot
yule a écrit:seraient plus "casse-gueule" car je ne suis pas certain que toutes les pages d'un sites soumis concerne que la finance.

Tout comme un annuaire pur la modération est de mise pour éviter ce genre de déboires dit toi bien qu'en plus une page "banane" dans "finance" ne sortira surement pas donc l'impact recherche devrait être limité tout en sachant que l'impact ressource lui n'est pas a négliger ce que la modération devrait résoudre.
yule a écrit:fait d'indexer les flux rss ... crawler régulièrement voir toutes les 10min pour un flux... argh...

L'idée des flux est bonne mais je pense que chercher a coller a une réalité et norme googlienne en cherchant le temps réel est une erreur. Un internaute comprendra facilement qu'il n'a de la nouveauté que toutes les 24H si en retour il a la qualité et le ciblage thématique. De plus, en repensant a la techno de crawl, si les crawl sont justement espacés (étalés) sur un cycle de 48 heures, il y a de la nouveauté en permanence même si c'est pas top synchro avec la réalité de publication. Au pire Quid d'un système "ping" pour palier a ce souci (en cas de techno distribuée notament)
yule a écrit:grosse alternative entre les gros moteurs et les bons annuaires

C'est ce qui fait l'originalité a mon avis de ton idée, et c'est en ce sens que distribuer cette technologie pour la mettre a disposition de sites tiers peut être un plus car tu propose réellement une recherche sur un réseau thématisé tout en offrant un service de référencement a côté donc une vraie visibilité.

Je répond a ton mp plus tard, je suis de mariage dans qques heures, mais je trouve ton système ++. Il n'a rien de très "nouveau" pour moi si ce n'est le concept de constituer une base de données via les crawls car j'utilise déjà ce style de script de recherche sur mon propre CMS (fulltext voir like ou regexp sur mot dans l'ordre en fonction des données qui sortent) mais je pense que cela peut être une idée a creuser car outre le fait que c'est pas non plus très courant, ça a le mérite d'offrir un service qui peut ouvrir une forme de marché novateur tant sous l'angle SEO que recherche.


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 11:57

le gros problème c'est de faire une recherche sur des données non structurées et, surtout, sur du code html. Là, les connaissances dans le traitement des langues naturelles seront une nécessité.
après, mettre une pondération sur le ndd et l'url risque de faire passer à la trappe nombre de sites pour lesquels aucun seo n'a eu à travailler mais pour lesquels le contenu peut être super intéressant.
par contre, je pense qu'il pourrait être bien que tu affectes un coefficient de pondération sur la "qualité d'expertise" que tu accordes au contenu de tel ou tel site


finstreet
WRInaute accro
WRInaute accro
 
Messages: 18091
Enregistré le: 10 Juil 2005

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 15:42

Leonick a écrit:le gros problème c'est de faire une recherche sur des données non structurées


le gros gros problème c'est de ne faire des recherches que sur des sites qui s'inscrivent sur des annuaires :) Un peu comme si tu faisais un site sur les comédiens où seuls les inconnus s'inscriraient faute d'être connus. Ca... limite.

Ca coute quoi de rajouter une centaine de sites Finance ? 1h de taf et encore


yule
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 283
Enregistré le: 23 Juil 2004

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 17:06

@zeb et Leonik

Bien cool tout ça, mais pour moi vous êtes loin de ma planète "connaissance prog etc.." rire, je reste sur des connaissances de base, ça l'air bien intéressant mais bien au-dessus de mes compétences.. (comme déjà dit, rien est pro, j'ai juste plaisir à mon niveau avec mes connaissances..)


finstreet a écrit:
Leonick a écrit:le gros problème c'est de faire une recherche sur des données non structurées


le gros gros problème c'est de ne faire des recherches que sur des sites qui s'inscrivent sur des annuaires :) Un peu comme si tu faisais un site sur les comédiens où seuls les inconnus s'inscriraient faute d'être connus. Ca... limite.

Ca coute quoi de rajouter une centaine de sites Finance ? 1h de taf et encore


Alors pour une heure voir 2... pas de soucis pour moi.. Néanmoins, il me semblait qu'on ne peut pas ajouter des sites à l'insu des webmasters ? Je me trompe ou c'est un non dit ??
Selon toi, je pourrais ajouter des sites dans ma base sans l'accord des titulaires des sites ? C'est bien ce que tu me dit ci-dessus ?

A+


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Moteur de sites dédié à la finance

Message le Sam Aoû 18, 2012 19:23

les ajouter, ça ne devrait pas poser de problème, mais les crawler, là, c'est une autre histoire...


finstreet
WRInaute accro
WRInaute accro
 
Messages: 18091
Enregistré le: 10 Juil 2005

Re: Moteur de sites dédié à la finance

Message le Dim Aoû 19, 2012 23:42

yule a écrit:Alors pour une heure voir 2... pas de soucis pour moi.. Néanmoins, il me semblait qu'on ne peut pas ajouter des sites à l'insu des webmasters ? Je me trompe ou c'est un non dit ??


Entre rajouter un lien d'un site finance sur un site porno et rajouter un lien d'un site finance sur un annuaire de finance, y'a un monde. Ca sera plus pertinent.


yule
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 283
Enregistré le: 23 Juil 2004

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 8:36

Hello

Ok j'en prends note mais ajouter un site lié à la finance et ne pas pouvoir les crawler ne me sert pas à grand chose...

A+
Yule


finstreet
WRInaute accro
WRInaute accro
 
Messages: 18091
Enregistré le: 10 Juil 2005

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 9:01

yule a écrit:Hello

Ok j'en prends note mais ajouter un site lié à la finance et ne pas pouvoir les crawler ne me sert pas à grand chose...

A+
Yule


Mais bien sur que tu peux le crawler. Il faut juste laisser la procédure pour expliquer aux sites comment ne pas être crawlés.


patapon87
WRInaute passionné
WRInaute passionné
 
Messages: 1396
Enregistré le: 12 Jan 2010

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 9:15

Leonick a écrit:les ajouter, ça ne devrait pas poser de problème, mais les crawler, là, c'est une autre histoire...

Il est interdit de crawler un site (ou une page) ???


Leonick
WRInaute accro
WRInaute accro
 
Messages: 22675
Enregistré le: 8 Aoû 2004

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 9:31

patapon87 a écrit:
Leonick a écrit:les ajouter, ça ne devrait pas poser de problème, mais les crawler, là, c'est une autre histoire...

Il est interdit de crawler un site (ou une page) ???
tu dois suivre la directive donnée par robots.txt et moi, par exemple, j'interdit tout sauf une dizaine de gros moteurs francophones.
sans compter qu'un site, c'est une base de données et qu'à ce titre il est protégé et que son exploration automatisée est interdite sans autorisation
Modifié en dernier par Leonick le Lun Aoû 20, 2012 9:32, modifié 1 fois.


finstreet
WRInaute accro
WRInaute accro
 
Messages: 18091
Enregistré le: 10 Juil 2005

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 9:31

Oui donc on est loin de l'interdiction systématique... mais par contre, étudier le robots.txt est effectivement plus que conseillé
Modifié en dernier par Marie-Aude le Lun Aoû 20, 2012 10:25, modifié 1 fois.
Raison: Suppression citation inutile. Merci de ne pas citer l'intégralité du post juste au dessus pour y répondre... ça allège la lecture


patapon87
WRInaute passionné
WRInaute passionné
 
Messages: 1396
Enregistré le: 12 Jan 2010

Re: Moteur de sites dédié à la finance

Message le Lun Aoû 20, 2012 9:42

Dernier HS sur le sujet mais ça m'a interpellé :
Je n'étudie pas la source de tout un site, juste un script qui se connecte à une page de deux site une fois par jour, le robot.txt est

User-Agent: *
Allow: /

et

User-agent: *
Disallow:

Suis-je dans l'illégalité ? (pour le coup aucun problème avec la notion de base de donnée)


yule
WRInaute occasionnel
WRInaute occasionnel
 
Messages: 283
Enregistré le: 23 Juil 2004

Re: Moteur de sites dédié à la finance

Message le Jeu Oct 08, 2015 21:53

Hello,

Finalement , le généraliste se porte mieux qu'un site dédié à une rubrique spécifique, donc avec les années je m'avoue vaincu sur mon écart, qui n'essaye rien n'a rien.... Picorne est dead... mais pas moi et ni mon projet initial ;-)

Çà faisait un petit moment que je n'étais venu... j'ai pris plaisir à lire vos articles sur le thème de ce forum et j'en conclu que le flou est toujours d'actualités sur ces satanés annuaires et moteurs :mrgreen: Duplicate, sans intérêt, pourquoi pas si c'est bien fait etc... Google et son dicta est toujours là, qu'on le veuille ou pas, on y passe du moment dessus.. une addiction ? une habitude ? Pas facile de l'avouer... N'empêche que c'est beau de voir des nouveaux projets, de se faire plaisir, de mettre en ligne une feuille blanche et s'éclater en y donnant vie, ça peut plaire, déplaire mais le but est de prendre plaisir dans ce qu'on fait, être utile parfois et surtout partager son plaisir.

Bonne bonne et à mon prochain passage
Yule


Formation recommandée sur ce thème :

Formation Netlinking (liens et référencement) : apprenez ce qu'est réellement un bon lien pour le référencement et comment éviter ou sortir d'une pénalité manuelle ou algorithmique due aux liens. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :