nutch

    11गर्मी

    1उत्तर

    मैंने nutch tutorial का पालन करने का प्रयास किया है लेकिन schema.xml फ़ाइल के साथ कोई समस्या है। मैं अपने प्रोजेक्ट, अनिवार्य रूप से यह करने के लिए Nutch प्रदान की स्कीमा लिए कहा गया था ... cp ${NUTCH

    8गर्मी

    2उत्तर

    यह पहली बार नहीं है जब यह प्रश्न स्टैक ओवरफ्लो पर asked रहा है - लेकिन यह लगभग पांच साल बाद है - और समय और प्रौद्योगिकियां थोड़ी-थोड़ी बदल गई हैं। मैं सोच रहा हूं कि लोग इन दिनों एक खोज इंजन बनाने के

    10गर्मी

    1उत्तर

    के साथ समस्याएं this मार्गदर्शिका के बाद, URL को क्रॉल करने के लिए अपाचे नच सेट अप करने का प्रयास कर रहा हूं। पुरानी मार्गदर्शिका होने के नाते (गाइड 1.x के लिए है, मैं 2.3 का उपयोग कर रहा हूं), मैंने

    5गर्मी

    2उत्तर

    पर सॉकेट खोलने में असमर्थ है, मैं hbase के लिए ज़ूकीपर आश्रम का उपयोग कर रहा हूं। जुकीपर 3 मशीनों पर चल रहा है। जबकि एचबीएएस पूरी तरह वितरित मोड में भी है। मेरे पास नच 2.x संस्करण है। जब मैं कुछ डेटा

    8गर्मी

    4उत्तर

    मैं इंटेलिज आईडीईए पर नच 2.1 स्रोत फ़ाइल (http://www.eu.apache.org/dist/nutch/2.1/) खोलना चाहता हूं। यहां ग्रहण पर इसे खोलने का तरीका बताया गया है: http://wiki.apache.org/nutch/RunNutchInEclipse हालां

    18गर्मी

    1उत्तर

    मैं एक वेबसाइट को क्रॉल करने की कोशिश कर रहा हूं, विशेष रूप से Google SiteManifoldCF का उपयोग कर रहा है जिसमें SAML प्रमाणीकरण और अपाचे सोलर में क्रॉल किए गए डेटा को अनुक्रमणित किया गया है। लेकिन जैसे

    5गर्मी

    2उत्तर

    मैं अपने यूआरएल फ़ाइल में डोमेन के पहले पृष्ठ पर क्रॉल करने के लिए नच का उपयोग करने की कोशिश कर रहा हूं और फिर क्रॉल किए गए डेटा खोजने योग्य कीवर्ड में कीवर्ड बनाने के लिए सोलर का उपयोग करने का प्रयास

    7गर्मी

    1उत्तर

    अपाचे नच क्रॉलर उदाहरणों की अधिकतम संख्या क्या है जो एक ही समय में एक मास्टर नोड के साथ चल सकती है?

    6गर्मी

    1उत्तर

    जब मैं निम्न आदेश के साथ nutch 1.10 चलाने के लिए, यह सोचते हैं कि TestCrawl2 पहले से मौजूद नहीं था और, बनाने की आवश्यकता है ... sudo -E bin/crawl -i -D solr.server.url=http://localhost:8983/solr/TestC

    5गर्मी

    4उत्तर

    Solr के लिए लोड हो रहा है, जबकि मैं Nutch ट्यूटोरियल http://wiki.apache.org/nutch/NutchTutorial अनुसार Nutch क्रॉलर चलाने की है, लेकिन यह मैं इस संदेश को यानी हो रही है Solr के लिए जब मैं लोड हो रहा ह