Problème de parsage d'un gros fichier xml de 12 Go
5 messages
• Page 1 sur 1
Consultez la formation à Google Analytics de WebRankInfo / Ranking Metrics
-

totoaussi - WRInaute discret

- Messages: 73
- Inscription: 22 Aoû 2010
Problème de parsage d'un gros fichier xml de 12 Go
Bonjour,
je cherche à parser un fichier xml de 12 Go. Et je le fait en ligne de commande avec la commande php sous un serveur linux de 4Go de RAM avec un core2Duo de 2,5Ghz.
Cependant, la fonction @simplexml_load_file("fichier.xml") semble avoir des limites,
car le script de parsage s'intérrompt en affichant "Processus arreté".
Pourtant au début de mon script, j'ai mis ces lignes :
ini_set('max_execution_time','0');
ini_set('memory_limit','-1');
mais ça ne change rien.
Savez-vous d'où vient le problème ?
Merci d'avance, cordialement.
je cherche à parser un fichier xml de 12 Go. Et je le fait en ligne de commande avec la commande php sous un serveur linux de 4Go de RAM avec un core2Duo de 2,5Ghz.
Cependant, la fonction @simplexml_load_file("fichier.xml") semble avoir des limites,
car le script de parsage s'intérrompt en affichant "Processus arreté".
Pourtant au début de mon script, j'ai mis ces lignes :
ini_set('max_execution_time','0');
ini_set('memory_limit','-1');
mais ça ne change rien.
Savez-vous d'où vient le problème ?
Merci d'avance, cordialement.
- SaintAmand
- WRInaute discret

- Messages: 90
- Inscription: 1 Mar 2011
Re: Problème de parsage d'un gros fichier xml de 12 Go
Bonjour,
Je ne connais pas ton SimpleXML, mais vu son nom, j'imagine qu'il utilise l'API DOM, et que la fonction simplexml_load_file charge le fichier en mémoire, n'est-ce-pas ? Auquel cas, il n'est pas étonnant que cela plante.
Pour des fichiers de cette taille, il te faut utiliser un parser qui utilise l'API SAX. Il permet d'analyser ton fichier comme un flux sans avoir besoin de le charger complètement en mémoire.
totoaussi a écrit:Cependant, la fonction @simplexml_load_file("fichier.xml") semble avoir des limites.
Savez-vous d'où vient le problème ?
Je ne connais pas ton SimpleXML, mais vu son nom, j'imagine qu'il utilise l'API DOM, et que la fonction simplexml_load_file charge le fichier en mémoire, n'est-ce-pas ? Auquel cas, il n'est pas étonnant que cela plante.
Pour des fichiers de cette taille, il te faut utiliser un parser qui utilise l'API SAX. Il permet d'analyser ton fichier comme un flux sans avoir besoin de le charger complètement en mémoire.
- SaintAmand
- WRInaute discret

- Messages: 90
- Inscription: 1 Mar 2011
Re: Problème de parsage d'un gros fichier xml de 12 Go
spout a écrit:Un fichier XML de 12 Go![]()
Il n'y a pas comme un petit problème de conception depuis le début de l'application ?
Pas forcément. Peut-être s'amuse t-il avec OpenStreetMap. Planet.osm c'est un gros XML de plus de 160 Go.
-

Julia41 - WRInaute passionné

- Messages: 1765
- Inscription: 31 Aoû 2007
Re: Problème de parsage d'un gros fichier xml de 12 Go
A mon avis, tu vas devoir le faire avec "autre chose" que PHP, en perl par exemple...
Est-ce que tu as des erreurs pour ton script :
Ca pourrait peut-être déjà te donner des pistes.
Est-ce que tu as des erreurs pour ton script :
- Code: Tout sélectionner
ini_set('display_errors', 1);
error_reporting(E_ALL);
Ca pourrait peut-être déjà te donner des pistes.
5 messages
• Page 1 sur 1
Formation recommandée sur ce thème :
Formation Google Analytics : en 2 jours, apprenez comment exploiter l'essentiel des possibilités de l'outil de mesure d'audience de Google. Formation animée par les experts Google Analytics de Ranking Metrics.
Tous les détails sur le site Ranking Metrics : programme, prix, dates et lieux, inscription en ligne.
Lectures recommandées sur ce thème :
- Problème de fou avec parsage de flux xml traded*** et encodage utf8 en php
- Gros fichier XML (500mo) => BDD : Quelle technique ?
- Parsage de fichier en Php
- problème de taille de fichier xml
- Problème ouverture fichier XML
- Problème lecture de fichier XML
- probléme d'interfaçage des fichier xml
- probleme du fichier xml de google sitemap
- Problème avec mon fichier sitemap.xml
- Sitemap.xml: Problème de fichier dans Webmaster Tools
Consultez la description détaillée des produits ou services de Google suivants : API Google Checkout
Qui est en ligne
Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 0 invités


