एक HTML दस्तावेज़ में तत्वों का विश्लेषण करने के लिए ScrapySharp का उपयोग कैसे करें?

यहाँ परियोजना अधिकारी "दस्तावेज़ीकरण" है:एक HTML दस्तावेज़ में तत्वों का विश्लेषण करने के लिए ScrapySharp का उपयोग कैसे करें?

https://bitbucket.org/rflechner/scrapysharp/wiki/Home

कोई फर्क नहीं पड़ता कि मैं क्या करने की कोशिश, मैं CssSelect() विधि है कि पुस्तकालय में जानना चाहते चीजों को आसान बनाने में जोड़ने के लिए माना जाता है नहीं मिल रहा। यहां मैंने जो कोशिश की है:

using ScrapySharp.Core; 
using ScrapySharp.Html.Parsing; 
using HtmlAgilityPack; 

HtmlWeb web = new HtmlWeb(); 
HtmlDocument doc = web.Load("http://www.stackoverflow.com"); 

var page = doc.DocumentNode.SelectSingleNode("//body"); 
page.CssSel???

वास्तव में मैं इस पुस्तकालय का उपयोग कैसे करूं? प्रलेखन में यह स्पष्ट नहीं है कि html किस प्रकार है।

स्रोत

2013-03-31 sergserg

मैं सिर्फ इस परियोजना के विकी अद्यतन किया है। https://bitbucket.org/rflechner/scrapysharp/wiki/Home मुझे उम्मीद है कि इसका उपयोग करना आसान होगा। अलविदा – rflechner

जोड़े

using ScrapySharp.Extensions;

ऐसा लगता है कि आपको लगता है कि खो रहे हैं। इसे CssSelect उपलब्ध कराया जाना चाहिए।

शायद ज़रुरत पड़े एक उदाहरण में मदद करता है, यहाँ एक विधि के रूप में अच्छी तरह से है, यह है कि मैं एक परियोजना में उपयोग करें:

private string GetPdfUrl(HtmlDocument document, string baseUrl) 
{ 
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString(); 
}

स्रोत

2013-03-31 07:08:35

एक HTML दस्तावेज़ में तत्वों का विश्लेषण करने के लिए ScrapySharp का उपयोग कैसे करें?

उत्तर

संबंधित मुद्दे