2012-10-26 13 views
6

मैं वेबसाइटों को स्क्रैप और एक परियोजना मैं पर काम कर रहा हूँ के लिए छवियों को प्राप्त करने के लिए राम-राम (https://github.com/MatthewMueller/cheerio) का उपयोग कर रहा हूँ। मैं सोच रहा हूं कि $ (img) .attr ('src') को पूरी तरह से योग्य यूआरएल में बदलने के लिए Node.js (या कोई अन्य पैकेज) के साथ कोई आसान तरीका है? कभी-कभी मुझे "image.jpg" और अन्य बार "../../image.jpg" मिल जाएगा, और अन्य बार "//somepath/image.jpg"। शायद मैं सिर्फ नोड url मॉड्यूल पर :)Node.js scraping, परिवर्तित छवि src -> पूर्ण URL

+1

हमें स्क्रैप की गई साइट के यूआरएल की आवश्यकता होगी ... या ऐसी साइट का उदाहरण। किसी भी तरह से, मैं आपको इन मूल्यों को पार्स करने के लिए स्वयं को एक अतिरिक्त फ़ंक्शन बनाने की सलाह देता हूं। –

+0

ओह शानदार! मैं एक ही चीज़ से परेशान था, इनमें से प्रत्येक के लिए मैन्युअल रूप से समाधान लिख रहा था। भगवान को आशीर्वाद दो! – vishalv2050

उत्तर

9

देखो अपने समय के लिए किसी प्रकार की एक regex ... धन्यवाद याद कर रहा हूँ। विशेष रूप से url.resolve(from, to) जो आप खोज रहे हैं वह होना चाहिए।

+0

धन्यवाद !! मैं इसकी सराहना करता हूं। – ewindsor

संबंधित मुद्दे