मुझे सी # का उपयोग कर एक HTML फ़ाइल से टेक्स्ट निकालने की आवश्यकता है। मैं HTMLAgilityPack का उपयोग करने की कोशिश कर रहा हूं लेकिन मुझे कुछ पार्स त्रुटियां दिखाई दे रही हैं (टैग बंद नहीं हैं)। मैं इन दो विकल्पों का उपयोग कर रहा:सी # HTMLAgilityPack HTML से टेक्स्ट - पार्स त्रुटियां
htmlDoc.OptionFixNestedTags = true;
htmlDoc.OptionAutoCloseOnEnd = true;
वहाँ किसी भी प्रकार के विकल्प "सब ठीक करें" है। मुझे त्रुटियों की परवाह नहीं है, मैं सिर्फ सामग्री या बंद करना चाहता हूं।
धन्यवाद! मैं एक और अधिक HTMLAgilityPack समाधान की तलाश में था ... – tvr