5
मेरे पास doc.at('head/title').inner_html
शीर्षक है जो &
आता है और यह &
होना चाहिए।Nokogiri रूबी में HTML को अनदेखा करने के लिए, और &
मेरे मूल दस्तावेज है:
<head><title>Foo & Bar</title></head>
लेकिन के रूप में बाहर आता है निम्नलिखित:
>> doc = Nokogiri::HTML.parse(file, nil, "UTF-8")
>> doc.at('head/title')
=> #<Nokogiri::XML::Element:0x..fdb851bea name="title" children=#<Nokogiri::XML::Text:0x..fdb850808 "Foo & Bar">>
>> doc.at('head/title').inner_html
=> "Foo & Bar"
मैं iconv या सीजीआई उपयोग करने के लिए की तरह नहीं करना चाहती:
>> require 'cgi'
>> CGI.unescapeHTML(doc.at('head/title').inner_html)
=> "Foo & Bar"
वह बदसूरत और असुविधाजनक है।