के साथ जावा robots.txt पार्सर मैं जावा में robots.txt पार्सर की तलाश में हूं, जो Googlebot के समान pattern matching rules का समर्थन करता है।वाइल्डकार्ड समर्थन
मैं रोबोट पाठ फाइलों पार्स करने के लिए कुछ librairies पाया है, लेकिन उनमें से कोई Googlebot-शैली पैटर्न मिलान का समर्थन करता है:
- Heritrix (वहाँ इस विषय पर एक open issue)
- Crawler4j (दिखता है Heritrix रूप में एक ही कार्यान्वयन)
- jrobotx तरह
किसी को भी है कि यह कर सकते हैं एक जावा पुस्तकालय का पता है?
मेरा मानना है कि पूर्व क्रॉलर काम करेंगे लायक । http://sourceforge.net/projects/ex-crawler/ – Fred