je voudrais faire un robot d'indexation
16 messages • Page 1 sur 2 • 1, 2
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
je voudrais faire un robot d'indexation
bonjour, j'utilise le code en dessous pour récupérer la source d'une page (j'essaie de construire un petit robot sans prétention), seulement certains caractères passe mal, comment puis-je régler ce problème merci (inutile de faire un replace, tout les caractères sont remplacé par ?)
ps: je suis en asp
Dim texte
Dim xml_http
Set xml_http = Server.CreateObject("Microsoft.XMLHTTP")
xml_http.Open "GET", "http://www.lesite.com", False
xml_http.Send
texte = xml_http.responseText
Set xml_http = Nothing
response.write texte
ps: je suis en asp
Dim texte
Dim xml_http
Set xml_http = Server.CreateObject("Microsoft.XMLHTTP")
xml_http.Open "GET", "http://www.lesite.com", False
xml_http.Send
texte = xml_http.responseText
Set xml_http = Nothing
response.write texte
non cela ne marche pas
je lis en utf
j'ai même essayé
Dim texte
Dim xml_http
Set xml_http = Server.CreateObject("Microsoft.XMLHTTP")
xml_http.Open "GET", url, False
xml_http.setRequestHeader "Content-Type", "text/xml; charset=utf-8"
xml_http.Send
texte = xml_http.responseText
Set xml_http = Nothing
je lis en utf
j'ai même essayé
Dim texte
Dim xml_http
Set xml_http = Server.CreateObject("Microsoft.XMLHTTP")
xml_http.Open "GET", url, False
xml_http.setRequestHeader "Content-Type", "text/xml; charset=utf-8"
xml_http.Send
texte = xml_http.responseText
Set xml_http = Nothing
Oui et je suppose que tu affiche en ISO, ce qui explique le problème d'affichage. Si c'est ca, j'ai eu le cas avec les fichiers xml d'amazon et j'ai été obligé de me taper une fonction de conversion à la main pour les principaux caractères accentués, de mémoire ils étaient sous la forme ˜&un autre code bizarre;
- petit-ourson
- WRInaute passionné

- Messages: 843
- Inscription: Lun Mai 31, 2004 15:19
J'ai eu ce même problème, en voulant faire un truc en asp alors que cela fonctionnait bien en vbscript.
Je n'ai aps trouvé de solutions.
Je n'ai aps trouvé de solutions.
Bonjour,
J'ai le même problème qu'angelus_2. Le problème est constaté lorsque je veux récupérer une page html via l'objet xmlhttp qui contient un caractère accentué en dur : le mot états s'affiche ?ts. Si le caractère accentué est codé en html tout se passe très bien : états s'affiche états .
J'ai aussi tenté des replaces sans succés, idem avec un htmlencode ou en utilisant l'objet MSXML2.ServerXMLHTTP à la place de Microsoft.XMLHTTP.
Crawl_url = request.querystring("lurl")
Set objCon = Server.CreateObject ("Microsoft.XMLHTTP")
'Set objCon = Server.CreateObject("MSXML2.ServerXMLHTTP")
objCon.Open "GET", Crawl_url, False, "", ""
objCon.SetRequestHeader "Content-type", "text/html"
objCon.Send
strPage = objCon.ResponseText
response.write strPage
Y-a-t-il quelque chose à définir dans le global.asa ?
Existe-t-il d'autres objects pour récupérer le source d'une page web ?
Merci
J'ai le même problème qu'angelus_2. Le problème est constaté lorsque je veux récupérer une page html via l'objet xmlhttp qui contient un caractère accentué en dur : le mot états s'affiche ?ts. Si le caractère accentué est codé en html tout se passe très bien : états s'affiche états .
J'ai aussi tenté des replaces sans succés, idem avec un htmlencode ou en utilisant l'objet MSXML2.ServerXMLHTTP à la place de Microsoft.XMLHTTP.
Crawl_url = request.querystring("lurl")
Set objCon = Server.CreateObject ("Microsoft.XMLHTTP")
'Set objCon = Server.CreateObject("MSXML2.ServerXMLHTTP")
objCon.Open "GET", Crawl_url, False, "", ""
objCon.SetRequestHeader "Content-type", "text/html"
objCon.Send
strPage = objCon.ResponseText
response.write strPage
Y-a-t-il quelque chose à définir dans le global.asa ?
Existe-t-il d'autres objects pour récupérer le source d'une page web ?
Merci
petit clin d´oeil à ce topic :
http://www.webrankinfo.com/forums/viewtopic_22055.htm
J ai un truc (idée de projet) à te proposer si tu veux en MP....
http://www.webrankinfo.com/forums/viewtopic_22055.htm
J ai un truc (idée de projet) à te proposer si tu veux en MP....
herveG, tu nous fais perdre notre temps : ton lien n'a rien à voir avec le sujet. Vas donc voir ailleurs si tu n'as pas de réponse à apporter.
Pour l'heure ma question est toujours d'actualité, si quelqu'un a une idée je suis preneur....
merci
Pour l'heure ma question est toujours d'actualité, si quelqu'un a une idée je suis preneur....
merci
Solution trouvée sur un autre site via l'object MSXML2.serverXMLHTTP.4.0 et sa méthode responsetext
sFile = "test.txt"
Crawl_url = request.querystring("lurl")
Set objXMLHTTP = CreateObject("MSXML2.serverXMLHTTP.4.0")
objXMLHTTP.Open "GET", Crawl_url , False
objXMLHTTP.Send
set strm1=createobject("adodb.stream")
With strm1
.type = 1
.open
.write objXMLHTTP.responsebody
.savetofile sFile, 2' adSaveCreateOverWrite
.close
End With
set strm2=createobject("adodb.stream")
With strm2
.type = 2
'.charset="euc-kr" 'Use any proper charset
.charset="iso-8859-1" 'Use any proper charset
.open
.loadfromFile "test.txt"
'msgbox .readText
.close
End With
A+
sFile = "test.txt"
Crawl_url = request.querystring("lurl")
Set objXMLHTTP = CreateObject("MSXML2.serverXMLHTTP.4.0")
objXMLHTTP.Open "GET", Crawl_url , False
objXMLHTTP.Send
set strm1=createobject("adodb.stream")
With strm1
.type = 1
.open
.write objXMLHTTP.responsebody
.savetofile sFile, 2' adSaveCreateOverWrite
.close
End With
set strm2=createobject("adodb.stream")
With strm2
.type = 2
'.charset="euc-kr" 'Use any proper charset
.charset="iso-8859-1" 'Use any proper charset
.open
.loadfromFile "test.txt"
'msgbox .readText
.close
End With
A+
16 messages • Page 1 sur 2 • 1, 2
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par Julien Coquet, expert certifié officiellement par Google Analytics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Etude de Googlebot, le robot d'indexation de Google
- Etude de Googlebot, le robot crawler de Google (Fresh Bot, Deep Bot)
- Petit changement pour Slurp (le robot de Yahoo)
- Mise à jour de Google Images (16/04/2006)
- La danse de Googlebot :-) La Google Dance
- Googlebot, le robot d'indexation de Google
- Référencement : le problème des sessions des pages PHP
- Outil officiel de suppression de pages de l'index Google
- Sortie officielle de GoogleStats v2.0 !
- Tout pour indexer vos contenus dans Google
- Je voudrais changer d'Email
- je voudrais changer d'hébergeur
- Je voudrais retrouver mon www.example.com
- Je voudrais etre sur de bien comprendre
- Mon coup de gueule : je voudrais que WRI s'arrête !
- Je voudrais essayer Adsense pour les recherches ?
- Je voudrais proposer mon annuaire en marque blanche
- aidez moi je voudrais référencer mon site
- Je voudrais des infos sur les templates
- je voudrais savoir ce qui doit apparaître dans une charte
- Bonjour les Pros du Forum , Je voudrais votre avis
- Sitemap, Bon ou pas ? je voudrais faire une modif
- voudrais trouver mod titre post et forum dans url
- SVP je voudrais améliorer mon référencement sur google
- je voudrais votre avis (site perso / nom de domaine)
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Googlebot
- Déterminer l'âge d'un site
Cet outil vous permet de connaître une estimation de l'ancienneté d'un site : il fournit la date à laquelle Google l'a indexé la première fois (et la même chose pour archive.org). - Liste de sous-domaines
Cet outil vous permet de trouver la liste des sous-domaines (indexés) d'un site.
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum