यह एक पुनरावर्ती प्रश्न प्रतीत होता है, लेकिन यहां जाता है।सभी शब्दों को संशोधित करने के लिए एचटीएमएल का विश्लेषण कैसे करें
मेरे पास HTML है जो अच्छी तरह से स्वरूपित है (यह एक नियंत्रित स्रोत से आता है, इसलिए इसे दिया जा सकता है)। मुझे HTML के शरीर की सामग्री के माध्यम से पुन: प्रयास करने की आवश्यकता है, दस्तावेज़ में सभी शब्दों की तलाश करें, उन शब्दों पर कुछ संपादन करें, और परिणामों को सहेजें।
उदाहरण के लिए, मेरे पास फ़ाइल sample.html है और मैं इसे अपने एप्लिकेशन और उत्पाद output.html के माध्यम से चलाने के लिए चाहता हूं, जो मूल के साथ ही मेरे संपादन के समान ही है।
मुझे HTMLAgilityPack का उपयोग करके निम्नलिखित पाया गया है, लेकिन मैंने पाया है कि सभी उदाहरण निर्दिष्ट टैग के गुणों को देखते हैं - क्या कोई आसान संशोधन है जो सामग्री को देखेगा और मेरे संपादन करेगा?
HtmlDocument HD = new HtmlDocument();
HD.Load (@"e:\test.htm");
var NoAltElements = HD.DocumentNode.SelectNodes("//img[not(@alt)]");
if (NoAltElements != null)
{
foreach (HtmlNode HN in NoAltElements)
{
HN.Attributes.Append("alt", "no alt image");
}
}
HD.Save(@"e:\test.htm");
उपर्युक्त एएलटी टैग वाले छवि टैग के लिए उपरोक्त दिखता है। मैं फ़ाइल के <body>
में सभी टैग देखना चाहता हूं और सामग्री के साथ कुछ करता हूं (जिसमें प्रक्रिया में नए टैग शामिल हो सकते हैं)।
<html>
<head><title>Some Title</title></head>
<body>
<h1>This is my page</h1>
<p>This is a paragraph of text.</p>
</body>
</html>
और उत्पादन है, जो यह अपरकेस बनाने और इसे तिर्छा बनाने के बीच हर शब्द और विकल्पों लेता उत्पादन:
<html>
<head><title>Some Title</title></head>
<body>
<h1>THIS <em>is</em> MY <em>page</em></h1>
<p>THIS <em>is</em> A <em>paragraph</em> OF <em>text</em>.</p>
</body>
</html>
मैं क्या कर सकता है की
एक बहुत ही सरल नमूना निम्न इनपुट ले
विचार, सुझाव?
धन्यवाद, मुझे लगता है कि यह वही है जो मैं ढूंढ रहा था! – Elie