2011-08-12 15 views
6

मैं इन कैसे निकाल सकते हैं:मैं जेएसओपी 'दस्तावेज़' से गैर-ब्रेकिंग रिक्त स्थान कैसे हटा सकता हूं?

<td>&nbsp;</td> 

या

<td width="7%">&nbsp;</td> 

मेरी JSoup 'दस्तावेज़' से? मैंने कई तरीकों की कोशिश की है, लेकिन इन गैर-ब्रेकिंग स्पेस वर्ण सामान्य JSoup अभिव्यक्तियों या चयनकर्ताओं के साथ कुछ भी मेल नहीं खाते हैं।

+1

क्या आईडीई या टेक्स्ट एडिटर जैसे नोटपैड ++ में दस्तावेज़ खोलना संभव नहीं है और एक खोज और प्रतिस्थापन करें? या क्या आपका मतलब है कि आपको इसे प्रोग्रामेटिक रूप से करने की ज़रूरत है? – tw16

+0

JSoup एक लाइब्रेरी है जो किसी एप्लिकेशन के लिए HTML डेटा प्राप्त करती है। तो नहीं, आप जो सुझाव दे रहे हैं वह न केवल संभव है, बल्कि लागू नहीं है। :) –

+0

क्या यह पूरे दस्तावेज़ पर लागू होता है या केवल ' 'तत्वों के भीतर? वैसे, क्या आप जानते हैं कि एमएसआईई ब्राउज़र ने पूरी तरह खाली '' तत्वों के साथ समस्याएं प्रस्तुत की हैं? एक   'इस एमएसआईई दुर्व्यवहार के लिए क्लासिक वर्कअराउंड है। – BalusC

उत्तर

12

एचटीएमएल इकाई &nbsp; (Unicode character NO-BREAK SPACE U+00A0) जावा में वर्ण \u00a0 द्वारा प्रदर्शित किया जा सकता है। यह मानते हुए कि आप हर तत्व जो स्वयं का पाठ (और इस प्रकार नहीं हर पंक्ति के रूप में आप एक टिप्पणी में कहा) के रूप में है कि वर्ण निकालना चाहते हैं, उसके बाद निम्न चाहिए काम करने के लिए:

document.select(":containsOwn(\u00a0)").remove(); 

यदि आप वास्तव में पूरे लाइन को हटाने का मतलब है तो आपकी सर्वश्रेष्ठ शर्त वास्तव में लाइन द्वारा HTML स्वयं को स्कैन करना है।

संबंधित मुद्दे

 संबंधित मुद्दे