2010-05-12 15 views
5

से उच्चतम आवृत्ति शर्तों को प्राप्त करें मुझे कुछ ल्यूसीन इंडेक्स से उच्च आवृत्तियों के साथ शब्दों को निकालने की आवश्यकता है, ताकि उन्हें कुछ अर्थपूर्ण विश्लेषण के लिए उपयोग किया जा सके।ल्यूसीन इंडेक्स

तो, मैं शायद शीर्ष 30 सबसे अधिक मौलिक शर्तों (अभी भी थ्रेसहोल्ड पर निर्णय नहीं लेता, मैं परिणामों का विश्लेषण करूंगा) और उनके प्रति-सूचकांक की गणना करना चाहता हूं। मुझे पता है कि मैं कुछ परिशुद्धता खो सकता हूं क्योंकि पोटेशनल रूप से डुप्लिकेट गिरा दिया गया है, लेकिन अभी के लिए, कहें कि मैं इसके साथ ठीक हूं।

प्रस्तावित समाधान के लिए

तो, गति महत्वपूर्ण नहीं है, के बाद से मैं स्थिर विश्लेषण करना होगा, मैं कार्यान्वयन के सादगी क्योंकि im तो Lucene के साथ कुशल नहीं पर लहजे रखा और नहीं कर सकते मेरे मन लपेटो (शायद कहने की) इसके बारे में कुछ अवधारणाओं के आसपास ..

मुझे कुछ समान नमूने से कोई कोड नमूने नहीं मिल रहे हैं, इसलिए सभी ठोस सलाह (कोड, छद्म कोड, कोड नमूने के लिंक ...) सभी सलाह की सराहना करते हैं!

धन्यवाद!

उत्तर

2

इस पर एक नज़र डालें: http://sujitpal.blogspot.com/2009/02/summarization-with-lucene.html

वर्ग इस पेज में computeTopTermQuery विधि है जो आप आसानी से अनेक अनुक्रमित पर जाने के लिए पुनः स्थापित करने के लिए सक्षम होना चाहिए है।

+0

Thanx! वास्तव में मुझे क्या चाहिए! – Julia

+0

हाय दिमाग! मैं ल्यूसीन 4.4 का उपयोग कर रहा हूं इसलिए इसमें शब्द() विधि नहीं है? कृपया मेरी मदद करें! – Thangnv

+0

@ थांगनव आप इसके लिए एक अलग धागा खोलना चाहते हैं, या लुसीन जावा मेलिंग सूची ईमेल कर सकते हैं। मेरे पास ल्यूसीन 4.4 हाथ पर नहीं चल रहा है। और समय इन दिनों कम आपूर्ति पर रहा है ;-( – mindas

5

Luke का उपयोग करने का एक बहुत ही आसान तरीका होगा। 'अवलोकन' टैब पर, 'शीर्ष शब्द दिखाएं' बटन होता है जिसका उपयोग आपको आवश्यकतानुसार किया जा सकता है।

+0

यही तरीका है। और आप परिणामों को कॉपी-पेस्ट या यहां तक ​​कि निर्यात भी कर सकते हैं। –

+1

+1, यदि आप अपना कोड चलाने के लिए चाहते हैं तो ल्यूक का कोड आपको दिखाता है कि कैसे .... – Mikos

संबंधित मुद्दे