2013-03-31 8 views
5

यहाँ परियोजना अधिकारी "दस्तावेज़ीकरण" है:एक HTML दस्तावेज़ में तत्वों का विश्लेषण करने के लिए ScrapySharp का उपयोग कैसे करें?

https://bitbucket.org/rflechner/scrapysharp/wiki/Home


कोई फर्क नहीं पड़ता कि मैं क्या करने की कोशिश, मैं CssSelect() विधि है कि पुस्तकालय में जानना चाहते चीजों को आसान बनाने में जोड़ने के लिए माना जाता है नहीं मिल रहा। यहां मैंने जो कोशिश की है:

using ScrapySharp.Core; 
using ScrapySharp.Html.Parsing; 
using HtmlAgilityPack; 

HtmlWeb web = new HtmlWeb(); 
HtmlDocument doc = web.Load("http://www.stackoverflow.com"); 

var page = doc.DocumentNode.SelectSingleNode("//body"); 
page.CssSel??? 

वास्तव में मैं इस पुस्तकालय का उपयोग कैसे करूं? प्रलेखन में यह स्पष्ट नहीं है कि html किस प्रकार है।

+2

मैं सिर्फ इस परियोजना के विकी अद्यतन किया है। https://bitbucket.org/rflechner/scrapysharp/wiki/Home मुझे उम्मीद है कि इसका उपयोग करना आसान होगा। अलविदा – rflechner

उत्तर

7

जोड़े

using ScrapySharp.Extensions; 

ऐसा लगता है कि आपको लगता है कि खो रहे हैं। इसे CssSelect उपलब्ध कराया जाना चाहिए।

शायद ज़रुरत पड़े एक उदाहरण में मदद करता है, यहाँ एक विधि के रूप में अच्छी तरह से है, यह है कि मैं एक परियोजना में उपयोग करें:

private string GetPdfUrl(HtmlDocument document, string baseUrl) 
{ 
    return new Uri(new Uri(baseUrl), document.DocumentNode.CssSelect(".table-of-content .head-row td.download a.text-pdf").Single().Attributes["href"].Value).ToString(); 
} 
संबंधित मुद्दे

 संबंधित मुद्दे