Insertion de flux rss dans une BD
6 messages • Page 1 sur 1
Consultez la formation au référencement naturel Google de WebRankInfo / Ranking Metrics
Insertion de flux rss dans une BD
Bonjour,
Je voudrais continuer la discussion http://www.webrankinfo.com/forums/viewtopic_94828.htm
Je suis bloqué techniquement :
j'aimerais récupérer plusieurs flux rss de mes différents sies (et d'autres encore : une dizaine en tout) et les intégrer à ma BD. j'ai plusieurs interrogations :
1- à quelle fréquence parser chaque flux pour intégrer les nouveaux articles à ma BD ?
2- au moment où je reparse le flux, comment savoir quels articles ont déjà été intégrés à ma BD et lesquels non afin de ne pas avoir des articles en double ?
précisions : je suis en php/mysql
merci de votre aide
Je voudrais continuer la discussion http://www.webrankinfo.com/forums/viewtopic_94828.htm
Je suis bloqué techniquement :
j'aimerais récupérer plusieurs flux rss de mes différents sies (et d'autres encore : une dizaine en tout) et les intégrer à ma BD. j'ai plusieurs interrogations :
1- à quelle fréquence parser chaque flux pour intégrer les nouveaux articles à ma BD ?
2- au moment où je reparse le flux, comment savoir quels articles ont déjà été intégrés à ma BD et lesquels non afin de ne pas avoir des articles en double ?
précisions : je suis en php/mysql
merci de votre aide
Ce que tu peut faire c'est tout ajouter dans ta table, ensuite tu fait un petit ménage, tu supprime toutes les entré en double quoi en comparant les différentes colonne.
En ce qui concerne la fréquence ça dépend de tes site si t'as un article par semaine ça sert à rien de faire tourné ton script toutes les heure par contre si t'a un article toutes les minutes la forcément faut faire tourné ton script souvent.
Sinon si tes sites sont sur le même serveur tu peut faire en sortent que des que tu poste un article ça le fout direct en double dans ton autre table pour chacun de tes sites.
En ce qui concerne la fréquence ça dépend de tes site si t'as un article par semaine ça sert à rien de faire tourné ton script toutes les heure par contre si t'a un article toutes les minutes la forcément faut faire tourné ton script souvent.
Sinon si tes sites sont sur le même serveur tu peut faire en sortent que des que tu poste un article ça le fout direct en double dans ton autre table pour chacun de tes sites.
Mitsu a écrit:Ce que tu peut faire c'est tout ajouter dans ta table, ensuite tu fait un petit ménage, tu supprime toutes les entré en double quoi en comparant les différentes colonne.
En ce qui concerne la fréquence ça dépend de tes site si t'as un article par semaine ça sert à rien de faire tourné ton script toutes les heure par contre si t'a un article toutes les minutes la forcément faut faire tourné ton script souvent.
Sinon si tes sites sont sur le même serveur tu peut faire en sortent que des que tu poste un article ça le fout direct en double dans ton autre table pour chacun de tes sites.
merci de ta réponse : non : mes sites sont sur différents serveurs
sinon comment aire le tri sur les colonnes car ma BD va grossir et donc, le ti va être au bout d'un certain temps très long ...
pour info voici ma table :
id
datetime (index)
source (index)
tire
description
catégorie
lien
Tu fait le tri après chaque insertion, dans ton script qui tourne par exemple une fois par jour
Tu as une étape ou tu insert le contenu dans ta base de donné et juste après tu fait un tri ou tu divise toute les entré en double, tu regard les entré ou le titre et la description sont identique et tu vire ce qui y a en trop.
Tu as une étape ou tu insert le contenu dans ta base de donné et juste après tu fait un tri ou tu divise toute les entré en double, tu regard les entré ou le titre et la description sont identique et tu vire ce qui y a en trop.
Mitsu a écrit:Tu fait le tri après chaque insertion, dans ton script qui tourne par exemple une fois par jour
Tu as une étape ou tu insert le contenu dans ta base de donné et juste après tu fait un tri ou tu divise toute les entré en double, tu regard les entré ou le titre et la description sont identique et tu vire ce qui y a en trop.
le jour ou j'aurais 10 000 entrées, ce ne sera pas trop lourd de faire une comparaison de tous les titres et descriptions ?
10 000 n'est pas si énorme que ça cela dit pour faire plus propre tu peu enregistrer dans un différent fichier tes donné (un qui affiche toutes les entrés, tu ajoute les entré a la fin du document et nom au début pour celui la), tu récupere ce fichier et t'insere tout dans ta bdd comme avec le fichier xml et sur une autre table tu sauvegarde l'endroit ou tu es dans le fichier (c'est un nombre qui dit à quel caractere tu es dans le fichier) ensuite quand tu relis le fichier tu li à partir de ce nombre, ainsi tu ne prend que ce qu'il y a de nouveau.
6 messages • Page 1 sur 1
Formation recommandée sur ce thème :
Formation Référencement naturel Google : apprenez une méthode efficace pour optimiser à fond le référencement naturel dans Google de façon durable... Formation animée par Olivier Duffez et Fabien Facériès, experts en référencement naturel.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Utiliser Actifpub pour l'intégration d'un flux RSS externe sur son site
- Intégrer facilement un flux RSS externe
- Un (RSS) pour tous (les blogs officiels de Google)
- Intégrer un flux RSS sur son site
- Des RSS rémunérés ça existe !
- Google Webmasters Tools indique le nombre d'abonnés à vos flux RSS/Atom
- Moteur de recherche de flux RSS / Atom
- Google rachète Feedburner
- Référencement vidéo sur Exalead
- La syndication de contenu : afficher un flux RSS sur son site
Consultez la description détaillée des produits ou services de Google suivants : Google Feed Fetcher, Google Reader, Google ReadAir
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités





le forum