मैं स्केपर के लिए नया हूं और मैं Ikea वेबसाइट वेबपृष्ठ को स्क्रैप करने की कोशिश कर रहा हूं। here दिए गए स्थानों की सूची वाला मूल पृष्ठ।स्केपर: लिंक और टेक्स्ट निकालें
मेरे items.py फ़ाइल नीचे दिया गया है
import scrapy
class IkeaItem(scrapy.Item):
name = scrapy.Field()
link = scrapy.Field()
और मकड़ी नीचे दिया गया है
import scrapy
from ikea.items import IkeaItem
class IkeaSpider(scrapy.Spider):
name = 'ikea'
allowed_domains = ['http://www.ikea.com/']
start_urls = ['http://www.ikea.com/']
def parse(self, response):
for sel in response.xpath('//tr/td/a'):
item = IkeaItem()
item['name'] = sel.xpath('a/text()').extract()
item['link'] = sel.xpath('a/@href').extract()
yield item
फ़ाइल मैं किसी भी उत्पादन नहीं मिल रहा है चल रहा है पर। जेसन फ़ाइल आउटपुट कुछ ऐसा है:
[[{"link": [], "name": []}
जो आउटपुट मैं ढूंढ रहा हूं वह स्थान और लिंक का नाम है। मुझे कुछ नहीं मिल रहा है। मैं गलत कहां जा रहा हूं?
आप की कोशिश की है allowed_domains "ikea.com" के रूप में? – aberna
@aberna इससे क्या अंतर आएगा? मैं उस ASAP को कोशिश करूंगा और कोई फर्क नहीं पड़ता। उत्पादन नही। –
यह प्रलेखन के रूप में स्केपर उदाहरण का पालन करेगा (http://doc.scrapy.org/en/latest/topics/spiders.html) – aberna