Google s'attaque aux formulaires
42 messages • Page 3 sur 3 • 1, 2, 3
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
-

Audiofeeline - WRInaute accro

- Messages: 5181
- Inscription: Jeu Oct 20, 2005 19:47
tonguide a écrit:[mode futuriste]En faites je sais, il veut pouvoir s'inscrire sur un forum, et à l'aide de son algo, il répond aux questions posé sur les sujets en plaçant directement un lien Adwords en relation[/mode futuriste]
Ca se fait, il me semble avoir déjà lu un article sur une intelligence artificielle capable de participer à un forum phpBB.
justement, ça peut être pour incorporer mieux les sites qui ont été développés avec les pieds.tonguide a écrit:En même temps, si tes produits ne sont pas accessibles sans devoir remplir un formulaire, s'est inquiétant pour le référencement mais aussi pour les visiteurs.
Et ça voudrait dire qu'on aura moins de chance de bien se positionner avec un site de quelques centaines de pages, contre des sites à plusieurs dizaines de milliers de pages mal codés, mais que gg arrivera à crawler
Enfin si ils sont mal codés, comme je le disais plus haut, à première vue, il risque probablement pas d'être optimiser pour le référencement (le mec qui rend pas accessible les pages, et qui optimise les pages à 200% pour le référencement, faut qu'il consulte)
Title identique partout à tous les coups, par la force des choses, aucun lien directe vers la page etc...
Bref, pour qu'avec ça, le site en question passe au dessus, je pense qu'il faudra se poser des questions sur son propre référencement.
Title identique partout à tous les coups, par la force des choses, aucun lien directe vers la page etc...
Bref, pour qu'avec ça, le site en question passe au dessus, je pense qu'il faudra se poser des questions sur son propre référencement.
Je remonte ce sujet pour faire une requête importante.
Voilà, Google s'acharne comme un dingue sur mes formulaires.
Malheureusement il ne respecte pas les id des select et s'amuse à entrer un nombre infini de possibilité en GET (bonjour le spam)
Comment l'obliger à respecter nos fourchettes mis en base ?
Si pas de solutions, comment l'interdire de crawler nos formulaires en GET en omettant l'interdiction total genre :
Voilà, Google s'acharne comme un dingue sur mes formulaires.
Malheureusement il ne respecte pas les id des select et s'amuse à entrer un nombre infini de possibilité en GET (bonjour le spam)
Comment l'obliger à respecter nos fourchettes mis en base ?
Si pas de solutions, comment l'interdire de crawler nos formulaires en GET en omettant l'interdiction total genre :
- Code: Tout sélectionner
<meta name="robots" content="noarchive,noindex,nofollow" />
j'ai exactement le même coup, et le pire c'est que derrière il référence le tout ... donc big duplicate vu que ça ne modifie qu'une légère partie de la page.
Donc assez simple ...
if (isset($_GET['nom_de_ta_variable_formulaire']))
{
echo '<noindex ...>';
}
Donc assez simple ...
if (isset($_GET['nom_de_ta_variable_formulaire']))
{
echo '<noindex ...>';
}
C'est ce que j'ai fait, en plus radical même : une belle page en 404 ! Merci quand même !
Bon sang, je trouve dommage que Google n'ait pas prévu dans "Outils pour les webmasters" un outil justement qui nous permet de lui indiquer nos id en base.
Pour les mots clef de type string, je peux comprendre (j'ai d'ailleurs suite à ça, remis en post un formulaire, permettant du texte), mais pour les formulaires de type int, dommage qu'il ne respecte pas les limites imposées par celui-ci et tente de son propre chef tout et n'importe quoi !
Dommage, l'idée est bonne, mais google n'a pas pensé à certaines conséquences, il met la charrue avant les boeufs !
Bon sang, je trouve dommage que Google n'ait pas prévu dans "Outils pour les webmasters" un outil justement qui nous permet de lui indiquer nos id en base.
Pour les mots clef de type string, je peux comprendre (j'ai d'ailleurs suite à ça, remis en post un formulaire, permettant du texte), mais pour les formulaires de type int, dommage qu'il ne respecte pas les limites imposées par celui-ci et tente de son propre chef tout et n'importe quoi !
Dommage, l'idée est bonne, mais google n'a pas pensé à certaines conséquences, il met la charrue avant les boeufs !
-

WebRankInfo - Administrateur du site

- Messages: 15905
- Inscription: Ven Avr 19, 2002 19:51
peux-tu nous montrer un exemple où Google teste + de valeurs que celles présentes dans ta balise select ?
Bon sang, J'me suis excité un peu trop vite, mea culpa, mais à demi quand même !
Je sais d'où vient ces retours de spam d'error !
Pour expliquer le souci, voilà un exemple d'error via la method get :
Dans mon script je ne peux pas faire autrement que d'imposer soit un département, soit une région...
Bref, google se fichant complètement de ce genre d'anomalie (ce qui peut se comprendre) engendre des erreurs 404 à foison.
Ce qui serait bien c'est de lui dire : toi gentil robot, quand toi prendre variable departement alors variable region sera toujours = 24.
Maintenant de mon côté, je peux faire en sorte d'imposer cette anomalie, la crainte et que cela va engendrer des centaines de redirection et par expérience, trop de 301 dans la tronche à google peut-être très pénalisant. En même temps les 404 ne sont pas non plus géniaux
La solution serait alors peut-être, même si cela ne respecte pas le protocole RFC, de mettre une belle page en 200 pour les internautes, avec un noindex dans le header, afin d'éviter le duplicate pour les moteurs de recherche.
Je sais d'où vient ces retours de spam d'error !
Pour expliquer le souci, voilà un exemple d'error via la method get :
- Code: Tout sélectionner
categorie => 1
departement => 38
region => 14
rubrique => 20
Dans mon script je ne peux pas faire autrement que d'imposer soit un département, soit une région...
Bref, google se fichant complètement de ce genre d'anomalie (ce qui peut se comprendre) engendre des erreurs 404 à foison.
Ce qui serait bien c'est de lui dire : toi gentil robot, quand toi prendre variable departement alors variable region sera toujours = 24.
Maintenant de mon côté, je peux faire en sorte d'imposer cette anomalie, la crainte et que cela va engendrer des centaines de redirection et par expérience, trop de 301 dans la tronche à google peut-être très pénalisant. En même temps les 404 ne sont pas non plus géniaux
La solution serait alors peut-être, même si cela ne respecte pas le protocole RFC, de mettre une belle page en 200 pour les internautes, avec un noindex dans le header, afin d'éviter le duplicate pour les moteurs de recherche.
Voilà, du genre ainsi -http://www.monsite.org/cherche.php?region=4&departement=90&rubrique=20&categorie=1
avec la balise meta :
Qu'en pensez-vous ?
En passant, le gentil robot, continue depuis minuit à faire toute les requêtes qu'il peut
Je crois que j'ai bien fait de mettre en post le formulaire texte, car j'imagine les milliers de possibilités de mots clefs... 
avec la balise meta :
- Code: Tout sélectionner
<meta name="robots" content="noarchive,noindex,nofollow" />
Qu'en pensez-vous ?
En passant, le gentil robot, continue depuis minuit à faire toute les requêtes qu'il peut
Dernière édition par david96 le Sam Oct 04, 2008 10:05, édité 2 fois.
Hé bé...
J'ai toutes les Courses de Chevaux ( de 10 à 20 courses/jour ), du 1er Janvier 2000 jusqu'à hier réactualisées tous les jours avec les courses de la veille.
15 * 365 * (2008 - 2000 + 1) = 49275 pages, sans compter les pages intermédiaires... A multiplier par 4 ou 5...
Les 10 derniers jours par des liens directs, le reste par un formulaire remplissable très facilement de manière automatique, vu que les variables sont dans dans des boîtes-listes ( jour, mois et année des courses ).
Si je comprend bien, Google va se remplir ses data centers. ;(
Là, ça va être plus que de l'inflation de données... Plutôt de l'hyper-inflation.
Bien à vous.
Amicalement.
Jean-François Ortolo
J'ai toutes les Courses de Chevaux ( de 10 à 20 courses/jour ), du 1er Janvier 2000 jusqu'à hier réactualisées tous les jours avec les courses de la veille.
15 * 365 * (2008 - 2000 + 1) = 49275 pages, sans compter les pages intermédiaires... A multiplier par 4 ou 5...
Les 10 derniers jours par des liens directs, le reste par un formulaire remplissable très facilement de manière automatique, vu que les variables sont dans dans des boîtes-listes ( jour, mois et année des courses ).
Si je comprend bien, Google va se remplir ses data centers. ;(
Là, ça va être plus que de l'inflation de données... Plutôt de l'hyper-inflation.
Bien à vous.
Amicalement.
Jean-François Ortolo
Je retire mon mea culpa !
Là on peut dire que le bot ne respecte plus le formulaire, car il omet un paramètre (la variable : categorie)
Ce qui génère bien entendu plein d'erreur 404 !
Là on peut dire que le bot ne respecte plus le formulaire, car il omet un paramètre (la variable : categorie)
- Code: Tout sélectionner
departement => 48
region => 24
rubrique => 20
Ce qui génère bien entendu plein d'erreur 404 !
Je ne comprend pas très bien...
1/ D'une part, Google dit qu'il ne faut plus faire d'url-rewriting.
2/ D'autre part, Google remplit désormais les formulaires.
Celà semblerait indiquer que le 1/ ne soit pas du à la nécessité ou volonté de Google, de limiter le nombre de ses pages indexées.
Donc, dans mon cas, l'url-rewriting n'ayant aucun autre incidence que celle-là, devrait donc être permise. Ouf.
En tout cas, ne vous semble-t-il pas, que 1/ et 2/ sont contradictoires ?
Bien à vous.
Amicalement.
Jean-François Ortolo
1/ D'une part, Google dit qu'il ne faut plus faire d'url-rewriting.
2/ D'autre part, Google remplit désormais les formulaires.
Celà semblerait indiquer que le 1/ ne soit pas du à la nécessité ou volonté de Google, de limiter le nombre de ses pages indexées.
Donc, dans mon cas, l'url-rewriting n'ayant aucun autre incidence que celle-là, devrait donc être permise. Ouf.
En tout cas, ne vous semble-t-il pas, que 1/ et 2/ sont contradictoires ?
Bien à vous.
Amicalement.
Jean-François Ortolo
42 messages • Page 3 sur 3 • 1, 2, 3
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Kinderstart.com attaque Google...
- L'AFP attaque Google
- Attaque en deny de service et Google
- Attaque du 15 juin Google, Yahoo, ...
- Une tricheuse attaque Google en justice
- Mon site attaqué par google !!!
- Attaque diffamatoire contre site & Google
- Mon site attaqué de toutes parts par google
- Google attaqué pour la fraude sur les clics dans les AdSense
- Attaque ???
- Site attaqué
- punbb attaqué
- Attaque DOS
- attaque d'alexa?
- Attaque de mon référencement ?
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités



le forum