Bonjour,
je monte un script qui me permet de supprimer d'un site tous les liens sortants vers un NDD domain.tld
j'ai tenté la regex suivante :
Pourquoi le premier .*? ???
Pour pouvoir gérer les cas où l'attribut title ou class du lien est placé entre le <a et le href.
Tout marche bien sauf dans les textes où plusieurs liens sont présents, car le premier .*? me prend tout le code compris entre l'ouverture du premier <a et le href du dernier lien vers domain.tld
Je bloque depuis hier. Merci pour votre aide.
je monte un script qui me permet de supprimer d'un site tous les liens sortants vers un NDD domain.tld
j'ai tenté la regex suivante :
Code:
preg_match('#<a.*?href=\"http:\/\/www.domain.tld.*?\".*?>(.*?)<\/a>#', $content, $out);
Pourquoi le premier .*? ???
Pour pouvoir gérer les cas où l'attribut title ou class du lien est placé entre le <a et le href.
Tout marche bien sauf dans les textes où plusieurs liens sont présents, car le premier .*? me prend tout le code compris entre l'ouverture du premier <a et le href du dernier lien vers domain.tld
Je bloque depuis hier. Merci pour votre aide.