Messages: 18175

Enregistré le: 23 Fév 2004

Message le Lun Aoû 07, 2006 11:57

Hello,

Je développe actuellement un petit "outil", par le biais duquel n'importe quelle URL peut techniquement exister, de par sa simple interrogation.

Exemple, Wikipedia: vous tapez http://fr.wikipedia.org/wiki/Je_vient_d ... cette_page dans votre navigateur, la page existe (vous venez de la "créer").

Celà ne me pose aucun problème que ces pages puissent être générées, mais cet outil sera modéré à priori, donc "tout ce qui n'est pas validé est invalidé".

Pour ce faire, une nouvelle page créée comme celà, "à la volée", sera donc accessible et consultable, mais je compte faire qu'elle soit non-indexable tant que son contenu n'a pas été validé par un admin:

>> non liée depuis une autre page du site
>> <meta name="robots" content="none"> inséré dans le <head>, pour prévenir l'indexation depuis un lien extérieur

Question:

Est-ce que quelqu'un a un retour d'expérience sur le fait de savoir si oui ou non Google ré-indexe une page qu'il pourrait avoir précédemment visitée, sur laquelle il a reçu un <meta name="robots" content="none">, qui ne serait plus présent quelques heures/jours plus tard ?

Si oui, avec-vous déjà constaté des délais "courts" ?

Merci.
Haut
9 Réponses
Messages: 4909

Enregistré le: 17 Aoû 2004

Message le Dim Sep 10, 2006 13:35

Re: <meta robots> content="none" temporaire.

HawkEye a écrit:Question:

Est-ce que quelqu'un a un retour d'expérience sur le fait de savoir si oui ou non Google ré-indexe une page qu'il pourrait avoir précédemment visitée, sur laquelle il a reçu un <meta name="robots" content="none">, qui ne serait plus présent quelques heures/jours plus tard ?

Si oui, avec-vous déjà constaté des délais "courts" ?

Merci.


Oui, je l'ai fait pour un ami, la maquette de son site a d'abord été hébergé temporairement sur un autre site (en répertoire), pour ne pas prendre le risque qu'il soit indexé j'ai demandé à ce qu'il soit en meta robot = "none". Lorsqu'il a été transféré sur son hebergement définitif, les "none" n'avaient pas été remplacé pendant plus de quinze jours, ne voyant pas d'indéxation j'ai vérifié et fait corriger. L'indexation s'est alors faite dans les 48 heures suivantes (précision : le sitmap a été régénéré et l'on a fait en sorte que les dates de dernière modification des fichiers aient changées).
Haut
Messages: 5

Enregistré le: 10 Juin 2008

Message le Mar Juin 10, 2008 21:09

question complementaire meta et liens

Bonjour je rebondis sur cette question qui se pose à moi pour référencer typiquement du contenu volatile.
Par contenu volatile, j'entends typiquement des annonces d'offres d'emploi ou autres.

Actuellement, j'ai généré des pages dynamiquement rewritées quand il s'agit d'un métier connu lors de la recherche.
Cependant, si la recherche n'offre pas de résultat, je ne voudrai pas référencer une page qui ne contient pas de résultat. Pour cela je comptais passer la page en <meta name="robots" content="none"> tant que la recherche ne retourne pas de résultat puis de la repasser en normale si des résultats apparaissent.

Cependant, on peut imaginer que certaines pages passent d'un état indexable à non-indexable assez régulièrement et je ne suis pas sure que google apprécie cela. Si vous pouviez me donner une solution à ce problème ?

Autre question complémentaire: Sur ma page de résultat, j'ai beaucoup trop de liens avec seulement 10 annonces car j'ai une vingtaine liens statiques par annonce. Dois je passer ces liens-ci en no-follow afin de mettre en valeur les autres ? dois je omettre leurs title ?

Merci d'avance pour vos retours et réponses.
Haut
Messages: 5

Enregistré le: 25 Sep 2008

Message le Jeu Sep 25, 2008 12:50

tiens nous au courant ça m'interresse...
Haut
Messages: 319

Enregistré le: 22 Jan 2006

Message le Ven Oct 03, 2008 20:33

Oui, avec un noindex, nofollow (bref la même chose), Google est très vite repassé et l'a réindexé quand cette balise a été modifiée.

Le tout est comme toujours d'avoir des liens. :roll:
Haut
Messages: 10

Enregistré le: 16 Nov 2006

Message le Mar Avr 06, 2010 16:19

sinon tu peux faire en sorte que robots.txt soit dynamique
Haut
Messages: 112

Enregistré le: 20 Avr 2010

Message le Mar Avr 20, 2010 17:47

D'après ce que je sais un simple noindex devrait suffire il me semble. sinon le mettre sous un htacess pour ne pas y avoir acces sans password
Haut
Messages: 18175

Enregistré le: 23 Fév 2004

Message le Jeu Avr 22, 2010 20:58

4 ans après, j'utilise effectivement htaccess qui est bien plus simple à gérer :)
Haut
Messages: 240

Enregistré le: 22 Sep 2005

Message le Sam Avr 24, 2010 13:58

C'est un sacré déterrage ou je m'y connais pas :)
Haut
Messages: 15

Enregistré le: 3 Juin 2008

Message le Mer Sep 01, 2010 12:22

moi je l'ai fais ca marche nickel
Haut
Messages: 12445

Enregistré le: 1 Mar 2005

Message le Mer Sep 01, 2010 14:27

laurentg25 a écrit:C'est un sacré déterrage ou je m'y connais pas :)

Deux ans ... c'est rien ... on a vu passer un 6 ans d'age récemment ..
Haut