[Google] Technique OCR pour indexer les fichiers PDF
4 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

Madrileño - Madrileño

- Messages: 28414
- Inscription: 7 Juil 2004
[Google] Technique OCR pour indexer les fichiers PDF
Google a publier un article concernant l'indexation des fichiers PDF et l'utilisation de système de type OCR (Reconnaissance optique de caractères) pour améliorer l'indexation des fichiers.
On peut voir quand même plus de 315 millions de fichiers PDF indexés sur Google.
Voir la commande filetype:pdf :
http://www.google.com/search?q=filetype%3Apdf
Les améliorations permettent d'avoir accès aux fichiers PDF au format HTML depuis les résultats de recherche Google.
Un des exemples officiel de Google : [repairing aluminum wiring]
Source et information : Official Google Blog : A picture of a thousand words ?
Qu'est l'OCR (Reconnaissance optique de caractères) : fr.wikipedia.org/wiki/OCR
On peut voir quand même plus de 315 millions de fichiers PDF indexés sur Google.
Voir la commande filetype:pdf :
http://www.google.com/search?q=filetype%3Apdf
Les améliorations permettent d'avoir accès aux fichiers PDF au format HTML depuis les résultats de recherche Google.
Un des exemples officiel de Google : [repairing aluminum wiring]
Source et information : Official Google Blog : A picture of a thousand words ?
Qu'est l'OCR (Reconnaissance optique de caractères) : fr.wikipedia.org/wiki/OCR
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
Google bosse aussi sur des projets Open Source dans l'OCR dans le cadre de Google Books (OCRopus , tesseract,...). Ya du boulot parce que les outils sont encore incomplets. Un petit tour d'horizon ici: http://www.robertviseur.be/page-news-cat-17.php (voir les articles avec OCR, dont qq tests de décodage de captchas ^^).
- Rod la Kox
- WRInaute accro

- Messages: 3253
- Inscription: 24 Juin 2008
Vu que les spammers OCRizent les antispam, heureusement que GG sait le faire...
-

ecocentric - WRInaute accro

- Messages: 3602
- Inscription: 10 Fév 2004
Rod la Kox a écrit:Vu que les spammers OCRizent les antispam, heureusement que GG sait le faire...
Je précise que je ne suis pas un spammeur; par contre, j'ai l'esprit joueur
4 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Référencement de fichiers pdf dont l'url n'est pas en pdf
- Faut-il indexer les pdf ?
- Ne pas indexer les PDF
- Fichiers PDF
- Forcer GG à indexer une page html plutôt qu'un PDF
- Indexation de fichiers *.pdf
- pagerank et fichiers pdf
- fichiers pdf dans le sitemap?
- outil de prévisualisation de fichiers PDF
- empêcher référencement fichiers PDF
Consultez la description détaillée des produits ou services de Google suivants : Google PDF Quick View, Gmail Mobile, Google Sites
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités
