information-retrieval

    7गर्मी

    3उत्तर

    समस्या: मैं करीब 20 ASCII पाठ फ़ाइलें, जिनमें से प्रत्येक का एक आकार कम से कम 10^9 बाइट्स .Another ASCII पाठ फ़ाइल (FOO कहते हैं) दिया जाता है । कार्यक्रम रणनीतिक रूप से दी गई 20 फाइलों के साथ खाद्य प

    5गर्मी

    2उत्तर

    के लिए कैलकुलेटिंग आईडीएफ (व्यस्त दस्तावेज़ आवृत्ति) दस्तावेज़ वर्गीकरण में आईडीएफ (व्यस्त दस्तावेज़ आवृत्ति) की गणना करने में मुझे संदेह है। मेरे पास प्रशिक्षण के लिए कई दस्तावेजों के साथ एक से अधिक

    7गर्मी

    4उत्तर

    मैं TREC प्रारूप के विनिर्देशों की तलाश में हूं। मैं बहुत गुस्सा कर रहा हूं लेकिन मुझे कोई सुराग नहीं मिला। क्या कोई यह जानता है कि इसके बारे में कोई जानकारी कहां प्राप्त करें?

    15गर्मी

    1उत्तर

    में प्रासंगिकता प्रतिक्रिया Solr में relevance feedback को लागू करना चाहूंगा। सोलर में पहले से ही More Like This सुविधा है: एकल दस्तावेज़ को देखते हुए, एकल इनपुट दस्तावेज़ की समानता के आधार पर समान दस

    12गर्मी

    4उत्तर

    मैं एक ऐसे अनुप्रयोग पर काम कर रहा हूं जो संदर्भ सूची में इकाई नामों को "साफ" करने के लिए संभावित "गन्दा" इकाई नामों के इनपुट सेट से मेल खाने का प्रयास करता है। मैं संपादन दूरी और अन्य सामान्य अस्पष्ट

    10गर्मी

    1उत्तर

    क्या पीडीएफ फाइल प्रोग्रामेटिक रूप से हाइलाइट किए गए टेक्स्ट और नोट निकालने का कोई तरीका है? किसी भी भाषा का स्वागत है। मुझे पाइथन, जावा और PHP के साथ कई पुस्तकालय भी मिले हैं लेकिन उनमें से कोई भी का

    6गर्मी

    1उत्तर

    मैं जानना चाहता हूं कि lucene.facet का उपयोग करके एक मुखौटा खोज कैसे करें। मैं बिल्कुल समझाऊंगा कि मैं क्या करना चाहता हूं: मुझे HTMLfiles (ओडीपी के समान) की वर्गीकरण मिली है और मैं चाहता हूं कि, एक क

    5गर्मी

    1उत्तर

    से हाइफेनेटेड और एस्ट्रोफ़े शब्द को समूहीकृत करना मुझे टेक्स्ट से शब्दों को विभाजित करने की आवश्यकता है। कुछ बार हाइफेनेटेड शब्दों को हाइफ़न के बिना लिखा जाता है, और एस्ट्रोफ़े शब्द शब्दों को एस्ट्रोफ

    8गर्मी

    2उत्तर

    मैं अमेज़न S3 पर छवियों को स्टोर करने के लिए कैसे अमेज़न S3 से पुनः प्राप्त करने की योजना पर संग्रहीत प्राप्त करें?

    14गर्मी

    1उत्तर

    मैं ल्यूसीन जैसे किसी एपीआई के बिना सर्च इंजन का एक सरल इंडेक्सिंग फ़ंक्शन बनाना चाहता हूं। उलटा इंडेक्स में, मुझे बस प्रत्येक शब्द की बुनियादी जानकारी रिकॉर्ड करने की आवश्यकता है, उदा। डॉकिड, स्थिति,