Site toujours pas référencé

Nouveau WRInaute
Bonjour,

Voila j'ai crée un blog vraiment pour du référencement, et faire quelques test : extension-et-agrandissement.fr

Quand je copier/coller l'url dans google, je ne trouve même pas le site ( il existe beaucoup d'autres sites sous presque la même forme ^^ ). Je l'ai mis en ligne il y a plus d'un mois, par contre il était en nofollow au début pour que je règle quelques problèmes, et peut être que Robot Google est passé dessus et la pris en compte comme cela, donc sinon comment pouvoir régler ce problème pour au moin pouvoir l'afficher dans les recherches google ! On verra après pour le référencement contenu...

Merci !
 
Nouveau WRInaute
Oui j'ai vu que google pourrait donner moin de poids aux NDD, mais je pense qu'il y a encore le temps et surtout la possibilité d'exploiter les NDD sans faire le bourrin avec 18 mots clés ! Après cela ne répond pas à ma question ^^
 
WRInaute passionné
Petite question : tu as créé ton site, d'accord, mais as-tu posté quelques liens en externe vers ton site (homepage), histoire que GG puisse tomber dessus?

Si tu ne l'as pas fait, il n'y a aucune raison pour que GG le découvre tout seul..... et ton site restera "non référencé" pendant encore uhne dizaine d'années...
 
Nouveau WRInaute
Oui j'ai fait ca du coup il y a quelques jours, enfin je n'ai pas mis le lien dans un homepage mais une page partenaire... je vais peut être le mettre dans la homepage du coup. Le truc c'est que je ne voulais pas de liens entre Site A et Blog B, qui traite du même sujet, enfin je ne sais pas si c'est "tres" important pour google ? Va t'il se dire que Le site A est propriétaire du Blog B ( en gros... ^^ ) ?
 
Nouveau WRInaute
Je pense que ce que voulait dire MikeR est qu'il vous faut un lien depuis un autre site vers la page d'accueil de votre Blog. L'inscrire sur un annuaire par exemple ou faire un échange de lien ou un communiqué de presse... bref l'essentiel est que des sites pointent vers votre page d'accueil pour que Google puisse revenir le plus souvent possible.

Même sans faire de liens Google saura si vous êtes propriétaire ou non du Blog, il est plus rusé que vous le pensez ^^
Et je ne pense pas que ça ait d'importance. Le tout est de ne pas faire un Blog avec pleins de liens qui pointent uniquement vers votre site, sinon vous allez être repéré.
 
WRInaute passionné
Regarde à quelle fréquence Googlebot passe sur ton site. Ca te donnera une idée de quand ton blog sera indexé (il faut d'abord que GG découvre le lien, ensuite qu'il explore et indexe le blog).
Après, si les thèmes sont les mêmes, avoir un lien sur la home de ton site pointant vers ton blog, ça peut se justifier (à condition qu'il n'y ait pas de DC entre les sites). L'avantage de la home, c'est qu'elle est souvent explorée plus fréquemment que les pages profondes.
 
Nouveau WRInaute
Ok je note tout ca ! C'est peu ce que je pensais, mais c'est vrai que ca commence à être long, j'ai balancé le site sur un annuaire assez propre et efficace, on verra dans les prochains jours, prochaines heure peut être !
 
WRInaute accro
Y en a t il qui regardent le site parfois ?
Code:
<meta name="robots" content="none" />
<meta name="googlebot" content="none" />
vire ça déjà si tu veux être indexé.
 
WRInaute accro
Etoile Web a dit:
bref l'essentiel est que des sites pointent vers votre page d'accueil pour que Google puisse revenir le plus souvent possible.
1/ c'est pas essentiel c'est faut
2/ la fréquence de passage n'est pas déterminé par la présence d'un lien ou pas.
3/ la cible du lien n'a rien a voir dans l'histoire.

Vous devriez faire attention a vos propos, des débutants pourrait comprendre des trucs qui sont totalement a l'ouest avec le sujet.

Au mieux on pourrait dire : "Il faut au moins un lien vers un site pour qu'un robot puisse le visiter" Mais ça ne préjuge de rien d'autre.
 
WRInaute accro
Sangohan62 a dit:
Oui j'ai vu que google pourrait donner moin de poids aux NDD, mais ...
Pour poursuivre le HS de SV il faut que tu sache deux choses :

1/ la dévaluation du poids du NDD dans les facteurs "qui positionnent" (donc présence de mots clés dedans) est effective depuis un moment. Mais c'est pas un souci car ce n'est pes une tare en soit d'avoir un EMD (Exact Match Domain > NDD qui correspond a la requête ciblée). IL semblerait (conditionnel) que GG ai ajusté un poil la différence qu'il fait entre un NDD EMD et Branding ces derniers temps mais c'est une supposition et c'est pas nouveau donc là encore pas grave.

2/ Les EMD sont pénalisant dans un cas précis et annoncé par GG. Il a en effet mis en place un genre de filtre qui permet de choisir parmi les EMD ceux qu'il estime de mauvaise qualité. Il faut donc comprendre qu'un site présentant un caractère "bas de gamme" (ça ne manque pas) et qui en plus utiliserait un EMD aurait plus de chance de s'en prendre une.

Pour te rassurer nous somme nombreux a exploiter des EMDs et ça ne va pas changer puisqu'ils sont l'essence du mnémotechnique quand on a pas une marque connue, mais on est obligé de veiller un peut plus a la qualité générale du site et surtout de lever le pied sur les anchors qui reprennent l'expression.
 
Nouveau WRInaute
zeb a dit:
Y en a t il qui regardent le site parfois ?
Code:
<meta name="robots" content="none" />
<meta name="googlebot" content="none" />
vire ça déjà si tu veux être indexé.

Merci je viens de le faire, je comprends pas pourquoi il était encore la, j'avais coché l'option d'indexage dans wordpress...

Et pour le NDD, oui ce n'est pas un blog qui a pour but d'avoir une réputation ou quoi que ce soit, donc ça passe !

Merci !
 
WRInaute accro
Sangohan62 a dit:
j'avais coché l'option d'indexage dans wordpress...
Je comprend pas trop pourquoi t'utilise ce truc. Un site il est soit disponible soit il doit être invisible (protégé derrière un htaccess). D'une part les balises robots c'est pas pris en compte par tout le monde (contrairement a une deny) et ensuite si tu met en ligne sans indexer pour "bosser ton site" et que ton concurrent se pointe (d'une façon ou une autre), te pompe le contenu pour le publier, qui c'est qui l'a dans l'os ? .... :wink:

Sur mon CMS tant que la config est sur "private" tu n'as accès qu'a une boite de login. C'est une solution intermédiaire a ce genre de souci. Les meta robots no index faut garder ça pour le traitement de certaines pages spécifiques pas pour protéger un site.
 
Nouveau WRInaute
Hum Zeb il est vrai que je ne suis pas allé regarder le code source, je pensais que les modifications avaient été faite, ce qui n'a pas été le cas ;-)

Par contre si on sort ma phrase du contexte dans lequel elle est il peut en effet y avoir un malentendu ;)
J'apportais une précision à ce qu'avait dit MikeR.

Et enfin je n'ai rien dit de faux, les liens mis en place sur d'autres sites favorisent bien le passage de Googlebot jusqu'à preuve du contraire ^^
 
Nouveau WRInaute
Oui exact... ! Je comptais l'enlever assez rapidement en fait, à la base ^^
Et le problème venait même pas de ça mais du d'une option du thème... ! Bref c'est réglé maintenant !

Mais, il y a encore beaucoup de chose que j'ignore, que ce soit en terme de code ou de référencement :)

En apprentissage ^^
 
WRInaute accro
Etoile Web a dit:
Je pense que ce que voulait dire MikeR est qu'il vous faut un lien depuis un autre site vers la page d'accueil de votre Blog. L'inscrire sur un annuaire par exemple ou faire un échange de lien ou un communiqué de presse... bref l'essentiel est que des sites pointent vers votre page d'accueil pour que Google puisse revenir le plus souvent possible.
Je remet dans le contexte alors (et en forme et en couleurs :D ).
Et je redis que faire pointer des sites ne changera rien a la fréquence que google choisira pour passer.
Un lien n'est qu'un vecteur d'indexation (en ce sens il n'en faut qu'un au minimum), La cadence (fréquence) de passage (passer le plus souvent possible) n'est aucunement déterminée par le nombre de liens.

Le fait qu'un site soit visité souvent ou pas (en régime stable donc au bout de qques temps d'activité régulière) tiens au nombre de nouvelles pages découvertes sur la période. Plus il y aura de changements sur l'accueil (par exemple, cas commun mais pas restrictif) avec apparition de nouveautés plus les bots reviendrons voir souvent cette page.

On a par ailleurs aucun moyen d'influer vers le haut cette fréquence de passage (hormis publier) et les techno de sitemap et autres flux du genre XML sont là pour justement minimiser le passage des bots (pas sur le flux mais sur le site).

Ensuite puisque j'ai remis dans le contexte, on se moque royalement que le lien posé soit vers l'accueil, un bot sait descendre dans une hiérarchie de documents donc il sait aussi la remonter.

Bref faut un lien au moins point.
 
Nouveau WRInaute
zeb a dit:
Le fait qu'un site soit visité souvent ou pas (en régime stable donc au bout de qques temps d'activité régulière) tiens au nombre de nouvelles pages découvertes sur la période. Plus il y aura de changements sur l'accueil (par exemple, cas commun mais pas restrictif) avec apparition de nouveautés plus les bots reviendrons voir souvent cette page.

Pourtant (mais non je n'insiste pas ^^) si un lien présent sur une page d'accueil (ou une autre) qui justement est régulièrement visitée pointe vers mon site, le bot ne reviendra t-il pas sur mon site ?
Je précise, que je me place dans le cas présent, soit pour un site nouveau, ou Google n'est pas encore passé souvent et ne dispose donc pas d'archives sur celui-ci.

Pour ce qui est de faire pointer vers la page d’accueil, je parlais là encore dans le cas d'un nouveau site. Il me semble que c'est alors plus important de faire pointer la page d'accueil plutôt qu'une page interne.
 
WRInaute accro
Etoile Web a dit:
Pourtant (mais non je n'insiste pas ^^) si un lien présent sur une page d'accueil (ou une autre) qui justement est régulièrement visitée pointe vers mon site, le bot ne reviendra t-il pas sur mon site ?
Je précise, que je me place dans le cas présent, soit pour un site nouveau, ou Google n'est pas encore passé souvent et ne dispose donc pas d'archives sur celui-ci.
C'est marrant car j'allais en parler dans mon post précédent et je me suis ravisé. :D

La présence d'un lien dans une page n'entraine pas le fait que le bot "suive le lien" cela entraine le rangement du lien (en fait de l'url) dans la pile d'url si il n'y est pas encore.
Bref un bot "n'enchaine pas les pages", il suit un programme précis basés sur un algo a eux mais c'est pas parce qu'il découvre un lien qu'il "jump" direct sur la page pouf la fagociter. Faut avant qu'il regarde si c'est une nouvelle url ou pas.
Alors bien sur si c'est une url inconnue il y a de forte chance pour que dans l'heure il aille faire un tour car il est vorace le GG mais rien ne dit que c'est le même bot qui va passer (si on se permet de les personnifier).

Imagine si ils suivaient systématique les liens qu'ils croisent en chemin comment certaines page serait inondées pour rien !
Sans parler du cas du lien réciproque qui fait que la page A enverrait le bot sur la page B qui le renverrait sur la A qui ....
le plan "lien réciproque" si il est évident entre deux sites se retrouve très souvent de façon interne sur un site aussi page A qui comprend un lien vers page B et réciproquement dans une même rubrique.

Faut que tu visualise une liste d'url connues auquel s'ajoute les nouvelles. A ces url tu ajoute une date de découverte et aussi un degré d'importance (je schématise en mode "simplet")
A côté de ça faut visualiser les bots qui prennent une url au fur et a mesure en fonction des priorité pour aller sauver le contenu de la page.
Derrière imagine d'autres bots qui vont effectuer des traitement spécifiques sur ces pages comme comparer a la version précédente pour voir si ça a bougé et peut être influer sur le fréquence de visite. D'autres feront des test graphiques pour vérifier qu'il y a pas trop de pub, d'autres encore feront des analyses syntaxiques pour chercher a comprendre le sens etc ...
Le bot qui crawl est en fait le plus "c0n" il se contente de pomper le contenu avec un curl en suivant son carnet de route.

Etoile Web a dit:
Pour ce qui est de faire pointer vers la page d’accueil, je parlais là encore dans le cas d'un nouveau site. Il me semble que c'est alors plus important de faire pointer la page d'accueil plutôt qu'une page interne.
En fait sincèrement je pense là encore que ça n'a aucune importance. As tu déjà fait un wget sur une page profonde en mode récursif ? Si oui tu te rend compte que cette fonction destinée a enregistrer une page est un peut comme un bot qui sauve le contenu et explore les urls trouvés dans la première page (si en mode récursif). Hors tous les sites (sauf peut être celui de tante ginette) ont un lien accueil sur toutes les pages. Bref si tu pompe n'importe quelle page du site, l'url de l'accueil sera dedans et tu peut être quasi certains qu'a la seconde itération l'accueil est découvert.

Donc entre nous ... est il fondamental de forcement lier l'accueil sachant qu'un "first crawl de gg" est aussi un "full crawl" et donc qu'il va te démonter le site a la vitesse minimum d'une page par seconde ? :wink:

Au même titre wget ne chope jamais deux fois la même page (même url), il gère une pile de parcours.

Pour savoir de façon pertinente ce que GG utilise je pense qu'il faudrait se pencher sur les algo de parcours des arbres pour voir ce qui est le plus optimum et le moins gourmand
 
Discussions similaires
Haut