डालता है मैं PHP टिडी का उपयोग करना चाहता हूं ताकि यह सुनिश्चित किया जा सके कि मेरा xml एक डोम डॉक्यूमेंट में लोड करने से पहले मान्य है।PHP टिडी व्हाइटस्पेस को हटा देता है और न्यूलाइन
हालांकि, मैं नहीं है साफ चाहते हैं मेरी स्वरूपण के लिए कुछ परिवर्तन करने के लिए - मैं सिर्फ यह असंतुलित टैग जैसी समस्याओं की मरम्मत के लिए चाहते हैं, आदि
समस्या का एक उदाहरण यह पेज पर देखा जा सकता: http://www.tek-tips.com/viewthread.cfm?qid=1654452
मेरा अपना उदाहरण निम्नलिखित है।
इनपुट: <ex><context>собр<stress>а</stress>ние</context> акцион<stress>е</stress>ров — <stress>aa</stress>ndeelhoudersvergadering</ex>
(जो मान्य XML पहले से ही है)
अपेक्षित उत्पादन: <ex><context>собр<stress>а</stress>ние</context> акцион<stress>е</stress>ров — <stress>aa</stress>ndeelhoudersvergadering</ex>
वास्तविक उत्पादन (वहाँ </context>
और актион
के बीच तोड़ने खाली स्थान के है):
<ex>
<context>собр
<stress>а</stress>ние</context>акцион
<stress>е</stress>ров —
<stress>aa</stress>ndeelhoudersvergadering</ex>
(इसे हटा दिया </context>
और актион
के बीच की जगह जो टेक्स्ट को अपठनीय बना देगी, और इसमें नया डाला गया प्रत्येक टैग के बाद लाइनों)
मेरे कोड है:
function TidyXml($inputXml)
{
$config = array(
'indent' => false,
'output-xml' => true,
'input-xml' => true,
);
$tidy = new tidy();
$tidy->parseString($inputXml, $config, 'utf8');
$tidy->cleanRepair();
$cleanXml = tidy_get_output($tidy);
return $cleanXml;
}
मैं कई विकल्प को बदलने की कोशिश की, लेकिन कामयाब नहीं हुए।
http जोड़ने से साफ को रोकने के लिए एचटीएमएल पर की जगह को चलाने के लिए सक्षम था। sourceforge.net/docs/quickref.html#output-xml – hakre
PHP सरल HTML डोम पार्सर सबसे अधिक से अधिक उदार पार्सर है। http://simplehtmldom.sourceforge.net/ – Petah
@ hakre मैंने 'input-xml '=> true' को छोड़कर सभी सेटिंग्स को हटा दिया (आवश्यक है क्योंकि अन्यथा यह एक पूर्ण HTML दस्तावेज़ आउटपुट करेगा)। हालांकि, यह मदद नहीं की। इसके अलावा मैंने 'output-xml' => false' सेट करने का प्रयास किया, लेकिन इससे मदद नहीं मिली। स्ट्रिपिंग/ट्रिमिंग और स्वरूपण को रोकने के लिए कुछ भी किया जा सकता है? –