Moteur de recherche sur les urls externes de twitter

Nouveau WRInaute
Bonsoir,

Nous venons de mettre en place un moteur de recherche sur les liens de twitter à titre d'exemple :
http://wikiwix.com/index.php?lang=fr&art=true&disp=article&action=photographie
et c'est dans le cadre :Activité récente sur le web pour photographie.

Classement en fonction de la recense du lien et de sa pertinence.

Tout est évidement récupérable via notre api:
http://api.wikiwix.com/opensearch.php?action=photographie&page=1&format=rss&target=twitter/fr/

Je suis preneur de tout retour.

Cordialement
Pascal
 
WRInaute impliqué
Je comprends pas le site. Quand j'arrive sur le site et que je lis le logo, je pense à un moteur de recherche sur wikipedia.

Vous voulez dire que tous les liens dans "Activité récente sur le web pour...." sont des liens extraits de twitter ?
 
Nouveau WRInaute
vitalizo a dit:
Je comprends pas le site. Quand j'arrive sur le site et que je lis le logo, je pense à un moteur de recherche sur wikipedia.

Vous voulez dire que tous les liens dans "Activité récente sur le web pour...." sont des liens extraits de twitter ?
Oui tout à fait c'est plus explicite lorsqu'on clique sur la croix pour avoir les résultats en pleine fenêtre.
Cordialement
Pascal
 
Nouveau WRInaute
finstreet a dit:
faudrait peut etre vous calmer en balancant le referer quand vous indexer non ? :)
Pourquoi, on indexe proprement, après le referer permet aux webmasters de savoir où il est sur le site.
Cordialement
Pascal
 
WRInaute accro
pm27 a dit:
finstreet a dit:
faudrait peut etre vous calmer en balancant le referer quand vous indexer non ? :)
Pourquoi, on indexe proprement, après le referer permet aux webmasters de savoir où il est sur le site.
Cordialement
Pascal

Ben un bot avec un referer, ca existe ? Le bot vient d'une marchine. Il a pas à annoncer qu'il vient d'ailleurs.
 
WRInaute accro
Une question intéressante. On peut cracher sur france.fr quand on a touché du fric d'Oseo ? Juste une question comme ca, pour savoir.Avant c'était "ne crache pas dans la main qui te nourrit", maintenant ca serait plutôt "oublie pas de l'écraser après avoir craché dedans".
 
Nouveau WRInaute
finstreet a dit:
Une question intéressante. On peut cracher sur france.fr quand on a touché du fric d'Oseo ? Juste une question comme ca, pour savoir.Avant c'était "ne crache pas dans la main qui te nourrit", maintenant ca serait plutôt "oublie pas de l'écraser après avoir craché dedans".
"Cracher" est un bien grand mot si tu fais allusion à http://blog.wikiwix.com/fr/2010/08/17/france-fr-la-baguette-et-le-kepi/,touché du fric est également un bien grand mot si tu fais allusion au logo.
En effet, je trouve que le partenariat entre marmiton, et le site france.fr est un peu borderline, après ce ne sont pas des subventions que donne l'oseo, mais des avances de trésorerie en gros un crédit.
...
 
Nouveau WRInaute
finstreet a dit:
ouais... enfin c un peu comme si je critiquais les sites internet de la même pépinière par exemple
France.fr et Wikiwix.com font partie de la même pépinière, vraiment je te comprends pas le site france.fr appartient à l'état, ma société non. Et même si celle - ci appartenait à l'état ce n'est pas pour autant que je ne critiquerai pas ce type de partenariat.
 
WRInaute accro
oui donc c'est ce que je disais au début. Tu craches dans la main qui te donne à manger. Chacun fait comme il veut ceci dit.
 
Nouveau WRInaute
finstreet a dit:
oui donc c'est ce que je disais au début. Tu craches dans la main qui te donne à manger. Chacun fait comme il veut ceci dit.
Parce que tu estimes que c'est france.fr qui me nourrit :)
 
WRInaute accro
j'estime juste que quand on touche des subventions, on s'écrase un minimum c'est tout. Mais comme déjà dit, tu fais comme tu veux.
 
Nouveau WRInaute
finstreet a dit:
j'estime juste que quand on touche des subventions, on s'écrase un minimum c'est tout. Mais comme déjà dit, tu fais comme tu veux.
Je discute pas avec une brouette je la pousse, je t'ai déjà dit que c'était pas des subventions.
 
WRInaute accro
C'est très fin. Si si très fin. Ca fait une semaine que tu indexes mon site en passant par un referer ce qui est crade au possible, et tu me traites de brouette. Finalement tu touches du fric d'Oseo, tu craches sur france.fr, maintenant tu craches sur les sites que tu indexes. Non vraiment belle preuve de professionnalisme. Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ? Non parce que pas le moindre pèt de Mentions Légales sur votre site, c'est assez comique :) A ce rythme là, ils font filer du fric pour monter un skyblog :)
 
Nouveau WRInaute
finstreet a dit:
C'est très fin. Si si très fin. Ca fait une semaine que tu indexes mon site en passant par un referer ce qui est crade au possible, et tu me traites de brouette. Finalement tu touches du fric d'Oseo, tu craches sur france.fr, maintenant tu craches sur les sites que tu indexes. Non vraiment belle preuve de professionnalisme. Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ? Non parce que pas le moindre pèt de Mentions Légales sur votre site, c'est assez comique :) A ce rythme là, ils font filer du fric pour monter un skyblog :)
Tu as raison à force de cracher j'ai plus de salive.
 
Nouveau WRInaute
finstreet a dit:
et donc vous avez pas de Mentions légales ? Faudrait peut etre demander un nouveau prêt pour développer la page :)
Tiens j'y avais pas pensé à demander un prêt pour cette page
 
WRInaute accro
pm27 a dit:
finstreet a dit:
et donc vous avez pas de Mentions légales ? Faudrait peut etre demander un nouveau prêt pour développer la page :)
Tiens j'y avais pas pensé à demander un prêt pour cette page

Bah sincèrement tu devrais :) A première vue ils ont plein de frics. Non mais sans déc. Vous êtes une boite. Vous avez un poil d'expérience. Vous trouvez pas que vous y gagnerez en crédibilité en inscrivant sur votre site, et pas le site de votre boite, vos mentions légales. En plus, c'est juste la loi qui vous l'impose. Et deuxio, expliquez la procédure pour éviter qu'on se fasse indexer par vos soins. Je crois que ca s'appelle l'éthique

Surtout que tu dis dans un post :
"D'un autre côté , des solutions techniques permettent de protéger un site de son indexation." Oui les solutions techniques se doivent d'être apportées par le moteur à la base. Sauf pour les moteurs bien pourris
 
WRInaute accro
mis à part les mentions légales, l'absende de procédure pour interdire votre indexation, vous vous faites indexés aussi les résultats de recherche par GG ? niveau parasitisme c'est pas mal aussi
 
WRInaute accro
finstreet a dit:
Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ?
respectent-ils le robots.txt ? parce que moi, en dehors de 3-4 plus gros moteurs, j'interdis aux autres, il ne devrait donc apparaitre dans mes logs que sur l'appel de robots.txt, normalement. C'est quoi sont UA ?
 
WRInaute accro
Leonick a dit:
finstreet a dit:
Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ?
respectent-ils le robots.txt ? parce que moi, en dehors de 3-4 plus gros moteurs, j'interdis aux autres, il ne devrait donc apparaitre dans mes logs que sur l'appel de robots.txt, normalement. C'est quoi sont UA ?

J'ai juste son ip. J'ai pas testé s'il respecte le robots.txt mais vu qu'il y a zéro info.
 
Nouveau WRInaute
Leonick a dit:
finstreet a dit:
Et c'est expliqué sur ton site, comment on peut bloquer le passage de votre bot ?
respectent-ils le robots.txt ? parce que moi, en dehors de 3-4 plus gros moteurs, j'interdis aux autres, il ne devrait donc apparaitre dans mes logs que sur l'appel de robots.txt, normalement. C'est quoi sont UA ?
Hors mis des bugs, nous respectons le fichier robots.txt, UA:wikiwix-bot. Cordialement
 
Nouveau WRInaute
Leonick a dit:
c'est la même ip que celle de son serveur public ? ou au moins la même range ip ?
195.221.21.171
195.221.21.172
195.221.21.173
195.221.21.150
195.221.21.225
195.221.21.227
195.221.21.229
195.221.21.231
195.221.21.235

Cordialement
 
WRInaute accro
impressionnant :) Plus d'un mois pour répondre à la question initiale posée sur un autre thread :) On va attendre un mois aussi sur le pourquoi vous mettez en cache des pages en leur supprimant leurs pubs ?
 
WRInaute accro
gg indexe déjà les données de twitter, donc quel est l'intérêt de faire indexer par gg des données déjà indexées par gg ? à part faire du spamindex ?
 
Nouveau WRInaute
Leonick a dit:
gg indexe déjà les données de twitter, donc quel est l'intérêt de faire indexer par gg des données déjà indexées par gg ? à part faire du spamindex ?
Nous indexons dans http://wikiwix.com les liens de twitter, qui ne sont pas nécessairement indexé par google. Cordialement
Pascal
 
WRInaute accro
VisitezMonSite a dit:
Notez que je n'en ai rien à faire, mais vraiment..
Par contre je trouve que c'est un manque de respect total mais je n'y vois rien d'étonnant, on voit pire tous les jours hahaha.
en même temps, "récupérer" du contenu de divers sites pour en faire son propre contenu et le faire indexer, peut-on déjà appeler ça du respect :twisted:
 
Nouveau WRInaute
Leonick a dit:
VisitezMonSite a dit:
Notez que je n'en ai rien à faire, mais vraiment..
Par contre je trouve que c'est un manque de respect total mais je n'y vois rien d'étonnant, on voit pire tous les jours hahaha.
en même temps, "récupérer" du contenu de divers sites pour en faire son propre contenu et le faire indexer, peut-on déjà appeler ça du respect :twisted:
Vous faîtes un amalgame de tout, je veux bien répondre aux questions qui sont posés, mais choisissez au moins un thread unique que le lecteur puisse suivre et par là même occasion je pourrais suivre aussi. Parce qu'actuellement je suis sollicité à la fois sur deux threads et sur une page de discussion de Wikipedia.
Cordialement
Pascal
 
WRInaute accro
Pardonnez moi mais j'ai du mal à comprendre l'intérêt de ce site. C'est un moteur de quoi ?
Et puis, vos pages sont très peu lisibles !
 
Nouveau WRInaute
A la base c'était un moteur de recherche sur les contenus de la fondation wikimedia , la colonne de gauche affiche les résultats des projets frères de wikipedia, la partie centrale étant les résultats de wikipedia.
En autocomplétion, il y a un moteur de recherche de site qui vous permet d'accéder rapidement à un nom de domaine.
Et dans la partie verte, ce sont les résultats provenant des liens qui sont twittés.
Cordialement
Pascal
 
Discussions similaires
Haut