मैं राम-राम के साथ मेरा अनुरोध इस तरह पार्स:Node.js बंदगी पार्सर टूट जाता है UTF-8 एन्कोडिंग
var url = http://shop.nag.ru/catalog/16939.IP-videonablyudenie-OMNY/16944.IP-kamery-OMNY-c-vario-obektivom/16704.OMNY-1000-PRO;
request.get(url, function (err, response, body) {
console.log(body);
$ = cheerio.load(body);
console.log($(".description").html());
});
और आउटपुट के रूप में मैं लेकिन अपठनीय अजीब एन्कोडिंग में सामग्री को देखने के:
//Plain body console.log(body) (p.s. russian chars):
<h1><span style="font-size: 16px;">Уличная 3Мп IP HD камера OMNY - попробуйте найти лучше</span></h1><p style
// cheerio's console.log $(".description").html()
<h1><span style="font-size: 16px;">Уличная 3Мп IP HD камера OMNY
लक्ष्य यूआरएल लिंक कोडिंग यूटीएफ -8 प्रारूप में है। तो क्यों चेरीओ मेरे एन्कोडिंग तोड़ता है?
iconv उपयोग करने के लिए अपने शरीर प्रतिक्रिया सांकेतिक शब्दों में बदलना करने के लिए कोशिश कर रहा है:
var body1 = iconv.decode(body, "utf-8");
लेकिन console.log($(".description").html());
अभी भी अजीब पाठ देता है।
जांच के संबंध में यह प्रतिक्रिया एन्कोडिंग के साथ काम करने के लिए : http:/
हालांकि, अगर आप unencoded पाठ प्राप्त करना चाहते हैं, तो आप
decodeEntities
विकल्पfalse
करने के लिए सेट कर सकते हैं /stackoverflow.com/questions/23805566/weird-characters-when-using-console-print-cheerio-nodejs – snozzaनहीं, अभी भी वही परिणाम :( – MeetJoeBlack