मैं जानना चाहता हूं कि जावा में robots.txt को कैसे पार्स करना है।robots.txt पार्सर जावा
क्या पहले से ही कोई कोड है?
मैं जानना चाहता हूं कि जावा में robots.txt को कैसे पार्स करना है।robots.txt पार्सर जावा
क्या पहले से ही कोई कोड है?
सोर्सफोर्ज में भी jrobotx library होस्ट किया गया है।
(पूर्ण प्रकटीकरण: मैं बंद कोड है कि पुस्तकालय का निर्माण करती है काता।)
भी क्रॉलर कॉमन्स की नई रिलीज़ नहीं है:
https://github.com/crawler-commons/crawler-commons
पुस्तकालय कार्यक्षमता आम लागू करने के लिए करना है किसी भी वेब क्रॉलर में और इसमें एक बहुत ही आसान robots.txt पार्सर
Robotstxt में एक बग शामिल है। कृपया इसका इस्तेमाल न करें। बहुत समय बर्बाद कर दिया। इस तरह की एक फ़ाइल के लिए: उपयोगकर्ता-एजेंट: * अस्वीकार करें:/ अनुमति दें रोबोटस्टक्स्ट की सभी विधि "सत्य" कहती है। – 10101010