var http = require('http');
var urlOpts = {host: 'www.nodejs.org', path: '/', port: '80'};
http.get(urlOpts, function (response) {
response.on('data', function (chunk) {
var str=chunk.toString();
var re = new RegExp("(<\s*title[^>]*>(.+?)<\s*/\s*title)\>", "g")
console.log(str.match(re));
});
});
आउटपुट एक स्क्रैप वेबपेज से पृष्ठ का शीर्षक हो रही
[email protected] ~ $ node app.js [ 'node.js' ] null null
मैं केवल शीर्षक प्राप्त करने की आवश्यकता।
var re = new RegExp("<title>(.*?)</title>", "i");
console.log(str.match(re)[1]);
@argonius के उदाहरण में एक अच्छा बिंदु है, कि आपको नियमित अभिव्यक्ति केस असंवेदनशील बनाने के लिए 'जी' के अलावा 'i' ध्वज का भी उपयोग करना चाहिए (क्योंकि '
जावास्क्रिप्ट के साथ शीर्षक सेट होने पर एसपीए वेब पृष्ठों के साथ काम नहीं करेगा। आपको Google क्रोम जैसे हेडलेस ब्राउज़र का उपयोग करना चाहिए –