Des documents sensibles sont enregistrés sur Google Docs!

Nouveau WRInaute
Bonjour,

J'ai mis à jour dernièrement mon site web, et j'ai eu un gros problème avec l'indexation de mes fichiers.

je recevais des CV au format DOC qui étaient enregistrés sur le serveur du site, dans un répertoire interdit d’accès aux robots, sauf que, lors de ma mise a jour, ces fichiers ont été indexés et sortent maintenant avec les résultats de recherche ( quand on tape le nom d'un candidat par exemple ).

J'ai revérifié le contenu du robots.txt qui est correct,
J'ai demandé a google webmasters de supprimer les fichiers indéxés,
J'ai supprimé les documents en question de mon serveur web,

Mon probleme, les documents restent accessibles en ligne car ils sont enregistrés sur google documents,

Je ne trouve pas comment les supprimer ? C'est très important que les données personnelles de mes contacts sont en ligne,

Merci de votre aide,

Stolz.
 
WRInaute accro
Url du site ? A mon sens, si quelqu'un ou un robot a accédé à tes fichiers, c'est que le dossier de stockage n'était pas sécurisé.
 
Nouveau WRInaute
Merci beaucoup UsagiYojimbo de ta réponse rapide, :)

Il l'etait, les fichiers ont été stockés de la sorte durant plus de 2 ans sans aucun probleme, la, tout sort,
J'ai pu faire en sorte que les fichiers ne soient plus lisibles directement, mais, ils restent dans le "cache" on je ne sais quoi de google documents,
Si on clique sur l'url du fichier, cela nous renvoi vers une redirection, ( page d'accueil ), mais si on clique sur le le petit "afficher", cela nous renvoi vers le document enregistré dans google documents qui lui est lisible meme si l'url qu'il donne n'existe plus.

L'url du site, je peux te la donner par MP, mais, je ne voudrais pas publier un lien vers mon site avec cette faille.
 
WRInaute passionné
Bonjour,

Sans donner l'url, tu peux toujours montrer ton script de sécurisation pour avoir des avis.

Rod
 
Nouveau WRInaute
Bonjour,

Je n'ai pas script de sécurisation,

J'ai juste mis un disallow pour le répertoire, et pour les extensions que je ne souhaite plus faire indexer, ( doc, docx, pdf, xls et xlsx )

Et puis c'est tout,

Il fallait faire autre chose ?



Merci :)
 
WRInaute passionné
Euh, depuis quand Google index nos documents personnels stockés sur Google Drive ?!
 
WRInaute passionné
stolz a dit:
Je n'ai pas script de sécurisation,
o0
stolz a dit:
J'ai juste mis un disallow pour le répertoire
Euhhhhh... le robots.txt, c'est juste pour dire "Ce truc ? non, pas la peine d'aller le voir."
Mais cela n'empêche personne d'y accéder.

- Tu charges ton robots.txt, GG passe au même moment, il ne le voit pas, il indexe.
- Le bot GG à une couille, il oublie de lire le robots.txt
- Un bot qui se moque du robots indexe les fichiers. GG les trouve chez lui.

Tout ce qui ne doit pas apparaitre sur le web et qui a un certain niveau de confidentialité doit être interdit physiquement d'être lu.
Ta parti admin, elle est sécurisée ou juste bloqué par robots.txt ?

Rod
 
WRInaute accro
XoSt a dit:
Euh, depuis quand Google index nos documents personnels stockés sur Google Drive ?!

Aucun rapport ici. Il s'agit des fichiers mis en cache en raison d'un manque de sécurisation du dossier de stockage.
 
WRInaute accro
Il ne s'agit pas de fichier stockés sur Google Doc, ils sont bien stockés physiquement sur le serveur qui héberge le site. Ce sont les versions en cache qui sont accessible via le reader de Google Doc.
 
WRInaute accro
stolz a dit:
Il l'etait, les fichiers ont été stockés de la sorte durant plus de 2 ans sans aucun probleme, la, tout sort
une sécurisation avec juste un blocage dans robots.txt, ça revient à protéger ta voiture contre le vol en mettant juste un autocollant "s'il vous plait, ne volez pas ma voiture" :mrgreen:
si le couple htaccess/htpasswd existe, c'est bien pour une raison. Le htaccess ne sert pas qu'à faire des réécriture d'url
si tu accède à une url privée via chrome ou une gg barre, gg aura ainsi des url à crawler, il suffit après que ton fichier robots.txt soit mal formé pour que ça autorise l'indexation
 
Olivier Duffez (admin)
Membre du personnel
le titre de la discussion est en effet erroné
cela dit Xost, va lire les CGU de Google Drive, tu verras... il y a de quoi être perplexe
 
Nouveau WRInaute
Bonjour,

Koxin-L.fr a dit:
Euhhhhh... le robots.txt, c'est juste pour dire "Ce truc ? non, pas la peine d'aller le voir."
Mais cela n'empêche personne d'y accéder.

Je devais mettre autre chose dans le robots.txt ? J'ai juste mis ça,

L'administration est bloquée, enfin, à ma connaissance,

Stolz
 
Nouveau WRInaute
UsagiYojimbo a dit:
Il ne s'agit pas de fichier stockés sur Google Doc, ils sont bien stockés physiquement sur le serveur qui héberge le site. Ce sont les versions en cache qui sont accessible via le reader de Google Doc.

C'est très bien résumé,

Sauf que j'ai supprimé les fichiers du serveur qui héberge le site mais ils restent toujours disponibles dans le cache de google et accessibles via le reader de Google Doc.

le problème, comment faire pour les retirer rapidement du cache ? ( je l'ai demandé via Google Webmaster mais cela tarde beaucoup )

Et surtout, que faire pour ne plus avoir ce genre de problèmes.

Merci beaucoup.
 
WRInaute accro
Il faut attendre. Tu n'a aucun autre recours si toutes les demandes nécessaires ont été faites. Et pour ce qui est du futur, il serait judicieux de mettre en place une sécurisation de ce dossier, par exemple via un couple .htaccess + .htpasswd.
 
Nouveau WRInaute
UsagiYojimbo a dit:
Il faut attendre. Tu n'a aucun autre recours si toutes les demandes nécessaires ont été faites. Et pour ce qui est du futur, il serait judicieux de mettre en place une sécurisation de ce dossier, par exemple via un couple .htaccess + .htpasswd.

Merci :) Bien noté
 
WRInaute passionné
WebRankInfo a dit:
le titre de la discussion est en effet erroné
cela dit Xost, va lire les CGU de Google Drive, tu verras... il y a de quoi être perplexe
Moi, j'ai renoncé à utiliser Google Drive, il y a trop d'incertitude sur l'utilisation que GG pourrait eventuellement faire du contenu stocké. .
 
Discussions similaires
Haut