code de recriture avec des classes spécifique

Consultez la formation URL Rewriting et sites dynamiques de WebRankInfo / Ranking Metrics

papa
WRInaute discret
WRInaute discret
 
Messages: 53
Inscription: Mar Sep 21, 2004 11:34

code de recriture avec des classes spécifique

Message le Mer Jan 23, 2008 11:14

Bon j'y arrive vraiment pas et je rencontre deux PB concret :

Pour aller de (la partie en italique existe mais peut/doit être ignorée)

toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html


à

toutes-les-locations.php?REGION=Bourgogne[&tralala=commentaires%20avec des espaces]&VariableFacutative1=1&VariableFacutative2=2

j'utilise

Code: Tout sélectionner
RewriteRule ^toutes-les-locations(,.+),([^,]+),([^,&]*)([^,]*)\.html toutes-les-locations$1&$2=$3$4\.html [N]
RewriteRule ^toutes-les-locations,([^,]+),([^,]*)(.*)\.html toutes-les-locations.php?$1=$2$3 [L]


Qui fonctionne mais je n'arrive pas à simplifier mes classes

et pour réecrire

location-gite-Clevacances,IMMOID,692,a,SOUGERES-en-PUISAYE-dans%20l-Yonne-Bourgogne.html
en
location-gite-Clevacances.php?IMMOID=692

Mon essai est lamentable et fait une erreur 500 et je n'y comprends rien

A l'aide SVP!!!!

PS : je reposte dans un nouveau fil car c'et un sujet différent quoique connex à mon PB de plantage qui a été résolu vos conseils éclairés


KOogar
WRInaute accro
WRInaute accro
 
Messages: 3334
Inscription: Mar Nov 16, 2004 18:27

Message le Mer Jan 23, 2008 13:27

c'est une bonne nouvelle que tu es résolu ton plantage serveur :)

-http://www.site.ext/toutes-les-locations,REGION,Bourgogne,tralala,commentaire%20avec des espaces,VariableFacutative1,1,VariableFacutative2,2.html

Ce genre d'url peut-etre prise pour une tentative de spam dans les moteurs. si l'idée est de donner du poid a la page, l'effet inverse peut se produire. Par exemple, ton flag tu pourrais le nommer "locations" tout simplement... Ne pas faire passer les commentaires car ca ne sert a rien et gonfler une url, comme je l'ai déjà souligné, peut avoir des effets pervers..

Les symboles pour réduire tes classes :
http://www.expreg.com/symbole.php

donc "Bourgogne" pourra etre remplacé par la classe [a-zA-Z], VariableFacutative1 par le classe [0-9] et ainsi de suite..

papa
WRInaute discret
WRInaute discret
 
Messages: 53
Inscription: Mar Sep 21, 2004 11:34

Message le Ven Fév 01, 2008 10:19

Merci,

Alors que je croyais mon pb résolu, un semaine plus tard mon serveur replante encore
je crois que ça vient de l'indexation qui adore les .html contrairement au .php et qui me bouffe tout mon temps processeur quand ils s'y mettent à trois en même temps (Google, voila et slurp)

Je vais donc encore resseré encore mes classes
Mais :
Question 1

Tu ne m'as pas préciser si le code ci dessous doit être placer en debut ou en fin de htaccess
Code: Tout sélectionner
### EMPECHE LE CODE DE BOUCLER
RewriteCond %{ENV:REDIRECT_STATUS} 200
RewriteRule ^.*$ - [L]





Question 2

J'ai trouver ce code pour eviter les crawlers parasites : un avis sur son efficacité ? je l'ai mis dans le htacces de la racine

Code: Tout sélectionner
# ATTENTION LISTE DES USER_AGENT NON VERIFIEE
# Voir http://www.toulouse-renaissance.net/c_outils.htm
# Version compacte
#
RewriteCond %{HTTP_USER_AGENT} ADSARobot|Anarchie|ASPSeek|Atomz|BackWeb|Bandit|BatchFTP|BlackWidow|Boston\ Project|BravoBrian\ SpiderEngine\ MarcoPolo|capture|ChinaClaw|CICC|Crescent\ Internet\ ToolPak|Custo|cyberalert|Digger|Digimarc|DIIbot|DISCoFinder|Download\ Demon|Download\ Wonder|Downloader|Drip|DSurf15a|EasyDL|efp@gmx\.net|Email\ Extractor|EirGrabber|EmailSiphon|Express\ WebPictures|EyeNetIE|FavOrg|FileHound|FlashGet\ WebWasher|FlickBot|GalaxyBot|GetRight|GetSmart|GetWeb!|gigabaz|GornKer|GrabNet|Grafula|Green\ Research|hloader|HMView|HomePageSearch|httpdown|http\ generic|IBM_Planetwide|Image\ Stripper|Image\ Sucker|imagefetch|InterGET|Internet\ Ninja|InternetLinkAgent|InternetSeer\.com|Iria|Irvine|JBH*Agent|JetCar|JOC|JOC\ Web\ Spider|JustView|Lachesis|LeechFTP|LexiBot|lftp|libwww|Link*Sleuth|LINKS\ ARoMATIZED|LinkWalker|lwp-trivial|Magnet|Mac\ Finder|Mag-Net|Mass\ Downloader|MIDown\ tool|Missigua\ Locator|MMMtoCrawl\/UrlDispatcherLLL|^Mozilla$|MSProxy [OR]
RewriteCond %{HTTP_USER_AGENT} Navroad|NearSite|Net\ Vampire|NetAnts|NetMechanic|NetSpider|NetZIP|NetZip\ Downloader|NetZippy|NPBot|Octopus|Openfind|PageGrabber|Papa\ Foto|PersonaPilot|pcBrowser|PingALink|Pockey|Proxy|psbot|Pump|QRVA|RealDownload|Reaper|Recorder|ReGet|RPT-HTTPClient|SearchExpress|Second\ Street\ Research|Seeker|SiteSnagger|SlySearch|SmartDownload|SpaceBison|SqWorm|Stripper|Sucker|SuperBot|SuperHTTP|Surfbot|Szukacz|tAkeOut|TV33_Mercator|URL_Spider_Pro|Vacuum|VoidEYE|Web\ Downloader|Web\ Image\ Collector|Web\ Sucker|WebAuto|Webclipping|Webdup|WebFetch|WebGo\ IS|WebHook|Webinator|WebLeacher|WebMirror|WebReaper|WebSauger|Website\ eXtractor|Website\ Quester|Webster|WebStripper|WebWhacker|WebZIP|Wget|Widow|Wweb|WWWOFFLE|Xaldon\ WebSpider|x-Tractor|Yandex [OR]
RewriteCond %{HTTP_USER_AGENT} ah-ha|aktuelles|amzn_assoc|ASSORT|ATHENS|attach|attache|autoemailspider|bdfetch|big.brother|bmclient|Bullseye|bumblebee|clipping|Crescent|Deweb|diagem|disco|DTS.Agent|ecollector|fastlwspider|Favorites\ Sweeper|Fetch|FEZhead|fluffy|Generic|Getleft|GetWebPage|Girafabot|go-ahead-got-it|Grabber|Harvest|hhjhj@yahoo|IncyWincy|informant|Ingelin|KWebGet|larbin|likse|LWP|MCspider|Mirror|Mister\ PiX|multithreaddb|nationaldirectory|NetCarta|netprospector|NetResearchServer|NEWT|nicerspro|OpaL|OpenTextSiteCrawler|OrangeBot|PackRat|pavuk|PSurf|puf|PushSite|replacer|RepoMonkey|Robozilla|Rover|Rsync|searchhippo|searchterms\.it|Shai|sitecheck|snagger|Spegla|SpiderBot|SurfWalker|tarspider|Templeton|TrueRobot|UIowaCrawler|UtilMind|vagabondo|vayala|visibilitygap|vspider [NC,OR]
RewriteCond %{HTTP_USER_AGENT} w3mir|web\.by\.mail|Web\ Data\ Extractor|webcollector|webcraft@bea|webdevil|webdownloader|WEBMASTERS|WebMiner|webmole|WebSnake|websucker|webvac|webwalk|webweasel|whizbang|WhosTalking|WISEbot|WUMPUS|XGET [NC,OR]
#
# FIN DE LA LISTE COMPACTE DES USER_AGENT NON VERIFIEE


Merci[/code]


KOogar
WRInaute accro
WRInaute accro
 
Messages: 3334
Inscription: Mar Nov 16, 2004 18:27

Message le Ven Fév 01, 2008 12:11

1° je pense que c'est mieux a la fin. Pas sur.

2° bah les crawlers c'est jamais tres mechants. ce qui peut te mettre ton serveur down ca serait les pompeurs de sites (teleport pro and co). Je te conseil de mettre un script anti aspirateur si tu ne l'a pas deja fait.

Avant de mettre la liste dans ton .htaccess, jete un oeil sur tes stats pour voir qu'elle sont les spiders qui pompent ta BP et peut-etre ne selectionner que ceux la pour ta liste.


Formation recommandée sur ce thème :

Formation URL Rewriting et sites dynamiques : apprenez comment mettre en place la réécriture d'URL, comment optimiser vos URL et profiter de vos pages dynamiques pour booster votre référencement. Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.

Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.

Lectures recommandées sur ce thème :



Qui est en ligne

Utilisateurs parcourant ce forum: seabird et 0 invités