मैं एक HTML दस्तावेज़ में तत्व खोजने के लिए PHP में DOMDocument और DOMXPath का उपयोग कर रहा हूं। इस दस्तावेज़ में HTML इकाइयां हैं जैसे & nbsp; और मैं इन इकाइयों को XPath आउटपुट में संरक्षित करना चाहता हूं।एचओएमएक्सपाथ को एचटीएमएल इकाइयों का विस्तार करने से कैसे रोकें?
$doc = new DOMDocument();
$doc->loadHTML('<html><head></head><body> Test</body></html>');
$xpath = new DOMXPath($doc);
$nodes = $xpath->query('//body');
foreach($nodes as $node) {
echo $node->textContent;
}
इस कोड को निम्नलिखित उत्पादन का उत्पादन (UTF-8):
[space]Test
लेकिन मैं चाहते हैं यह करने के लिए:
Test
शायद यह LibXML के साथ क्या करना है कि कुछ PHP आंतरिक रूप से उपयोग करता है, लेकिन मुझे कोई भी फ़ंक्शन नहीं मिला जो HTML इकाइयों को संरक्षित करता है।
क्या आपके पास कोई विचार है?
'[space]' यूटीएफ -8 नहीं है। क्या आप वाकई यू +0020 हैं और यू +00 ए 0 नहीं हैं? – Alohci
@Alohci: हाँ, आप सही हैं, यह U + 00A0 है। मैं बस स्पष्ट करना चाहता था कि आउटपुट को इकाई के बजाए व्हाइटस्पेस के साथ प्रदर्शित किया गया है। – chrisklaussner
@ डिमिट्री: क्षमा करें, लेकिन यह एक XPath विशिष्ट प्रश्न है। यह एक XPath क्वेरी के आउटपुट के बारे में है। – chrisklaussner