Spam reporting automatisé
5 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Spam reporting automatisé
Hello tous,
Depuis le temps que j'entend des personnes utilisant le Spam reporting de Google, je suis en train de me dire qu'un outils de détection automatique de spam serait une bonne idée de développement.
Voila mon idée:
- Effectuer une recherche Google sur un terme donné.
- Garder en mémoire les X premiers résultats
- Pour chaque résultat :
+ Visiter la page et ses dépendances JS et CSS
+ Vérifier la présence de META REFRESH
+ Parser le code JS à la recherche d'une redirection du genre "windows.location=..."
+ Faire ressortir la présence de DIV et de SPAN cachés (visibility:hidden, position négative)
- Puis afficher les résultats, une intervention humaine est alors nécessaire pour vérifier le caractère frauduleux des résultats.
- Ensuite, pour chaque résultat, possibilité de soumettre automatiquement à Google par le biais du formulaire disponible ici: http://www.google.com/contact/spamreport.html
Je ne sais pas si quelqu'un s'est déjà intéressé à ce genre de développement. Si c'est le cas, qu'il n'hésite pas à me faire partager soon expérience surtout en ce qui concerne l'interprétation du JavaScript.
Si vous connaissez d'autre techniques de Spamdexing, si vous avez d'autres idées sur la détection des techniques de Spamdexing ou si cette idée vous intéresse, faites m'en part.
Depuis le temps que j'entend des personnes utilisant le Spam reporting de Google, je suis en train de me dire qu'un outils de détection automatique de spam serait une bonne idée de développement.
Voila mon idée:
- Effectuer une recherche Google sur un terme donné.
- Garder en mémoire les X premiers résultats
- Pour chaque résultat :
+ Visiter la page et ses dépendances JS et CSS
+ Vérifier la présence de META REFRESH
+ Parser le code JS à la recherche d'une redirection du genre "windows.location=..."
+ Faire ressortir la présence de DIV et de SPAN cachés (visibility:hidden, position négative)
- Puis afficher les résultats, une intervention humaine est alors nécessaire pour vérifier le caractère frauduleux des résultats.
- Ensuite, pour chaque résultat, possibilité de soumettre automatiquement à Google par le biais du formulaire disponible ici: http://www.google.com/contact/spamreport.html
Je ne sais pas si quelqu'un s'est déjà intéressé à ce genre de développement. Si c'est le cas, qu'il n'hésite pas à me faire partager soon expérience surtout en ce qui concerne l'interprétation du JavaScript.
Si vous connaissez d'autre techniques de Spamdexing, si vous avez d'autres idées sur la détection des techniques de Spamdexing ou si cette idée vous intéresse, faites m'en part.
Tu comprendra en y réfléchissant que pour 8 milliard de pages il faudra vérifier à peu près 1 milliard de pages car elles comportent toute une description ou des mots ou un div qq part qui pourrait sembler "répréhensible".
Le mieux c'est comme fait google actuellement ca ne leur coute rien.
A partir d'un certain nombre de plaintes distinctes à propos d'un même site un être humain doté d'un cervau analyse le site.
./
Le mieux c'est comme fait google actuellement ca ne leur coute rien.
A partir d'un certain nombre de plaintes distinctes à propos d'un même site un être humain doté d'un cervau analyse le site.
./
En outre, par expérience j'ai pu constater que de nombreux scripts window.location.href sont parfois utiles, sans pour autant faire du spamdexing...
Idem pour les CSS, les div hidden ou autres display:none ; on les trouve régulièrement dans l'affichage d'éléments de menus, de versions imprimables, etc...
Alors du coup, le spam report automatisé me semble tout de suite beaucoup plus complexe.
Idem pour les CSS, les div hidden ou autres display:none ; on les trouve régulièrement dans l'affichage d'éléments de menus, de versions imprimables, etc...
Alors du coup, le spam report automatisé me semble tout de suite beaucoup plus complexe.
>>Røi
Je suis tout à fait d'accord. Je pensait plutôt à un scénario du genre:
J'essaie de ressortir sur tel ou tel terme de recherche mais je n'y arrive pas car de nombreux sites utilisent le spamdexing. J'effectue une analyse pour le ou les termes de recherche sur les X premières pages de résultats précédant mon apparition.
Cela resterais pour des applications très ciblées. Je pense bien qu'il est impossible de le faire pour l'essemble de l'index, je laisse d'ailleur Google s'en charger.
>>Bat
Je suis aussi d'accord avec toi, j'utilise d'ailleurs cette technique pour les menus de certains de mes sites. C'est pourquoi je pensait laisser à l'utilisateur la possibilité de vérifier manuellement les résultats de l'analyse. Si c'était plus simple, Google l'aurait déjà fait.
Je ne dit pas qu'un tel soft serait dépourvu d'erreur, mais pour la pluspart des cas, c'est quand-même flagrant et facile à détecter.
Je suis tout à fait d'accord. Je pensait plutôt à un scénario du genre:
J'essaie de ressortir sur tel ou tel terme de recherche mais je n'y arrive pas car de nombreux sites utilisent le spamdexing. J'effectue une analyse pour le ou les termes de recherche sur les X premières pages de résultats précédant mon apparition.
Cela resterais pour des applications très ciblées. Je pense bien qu'il est impossible de le faire pour l'essemble de l'index, je laisse d'ailleur Google s'en charger.
>>Bat
Je suis aussi d'accord avec toi, j'utilise d'ailleurs cette technique pour les menus de certains de mes sites. C'est pourquoi je pensait laisser à l'utilisateur la possibilité de vérifier manuellement les résultats de l'analyse. Si c'était plus simple, Google l'aurait déjà fait.
Je ne dit pas qu'un tel soft serait dépourvu d'erreur, mais pour la pluspart des cas, c'est quand-même flagrant et facile à détecter.
Dernière édition par magicaxe le Lun Oct 24, 2005 19:40, édité 1 fois.
5 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Algorithme de détection du link spam de masse
- Spam Report Google : explications en français...
- 2 nouvelles astuces pour être bien visible dans Google News
- Yahoo Web Analytics (ex IndexTools)
- Articles de R et D sur le PageRank, le SpamRank et le spam...
- Description du TrustRank de Google
- l'attribut rel=nofollow contre le spam de commentaires ?
- Statistiques sur la blogosphère (Août 2006)
- L'attribut rel="nofollow" sur les liens : lutte contre le spam...
- Comment placer son blog dans Google Finance
- Reporting de campagne e-mail
- Programme automatisé de référencement
- Copyright automatisé sur photo
- Backup mysql automatisé sous mutualisé
- Un virus automatise la fraude Google Adsense
- Outil de reporting de visibilité de site web en open source
- service hébergement gratuit des sous domaines automatisé
- Référencement automatisé dans des milliers d'annuaires : utile ou non ?
- [SPAM] Moins de spam depuis quelques jours
- [SPAM] Spam violent de soumission de formulaire automatique
- Stop le spam avec Spam Poison Community
- Moyen de lutter contre le referer spam ou spam referer ...
- Spam ou pas Spam?
Consultez la description détaillée des produits ou services de Google suivants : Google TrustRank
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum