2012-05-08 10 views
6

कहें, अगर मैं मोंगोडीबी के ग्रिडएफएस का उपयोग करके पीडीएफ या ईपीब फाइलों को स्टोर करना चाहता हूं, तो क्या डेटा फ़ाइलों पर पूर्ण-पाठ खोज करना संभव है?मोंगोडीबी ग्रिडएफएस पर पूर्ण-पाठ खोज?

उत्तर

3

आप वर्तमान में मोंगो भीतर वास्तविक पूर्ण पाठ खोज नहीं कर सकते: http://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo

यहां इसके लिए वोट करने के लिए स्वतंत्र महसूस: https://jira.mongodb.org/browse/SERVER-380

मोंगो एक सामान्य प्रयोजन स्केलेबल डेटा का अधिक है स्टोर, और अभी तक इसमें कोई पूर्ण पाठ खोज समर्थन नहीं है। आपके उपयोग के मामले के आधार पर, आप टेक्स्ट में सभी शब्दों की सरणी के साथ मानक बी-पेड़ इंडेक्स का उपयोग कर सकते हैं, लेकिन यह स्टेमिंग या फ़ज़ी मैचों आदि नहीं करेगा।

हालांकि, मैं संयोजन की अनुशंसा करता हूं एक ल्यूसीन आधारित अनुप्रयोग के साथ mongodb (लोचदार खोज लोकप्रिय है)। आप अपने सभी डेटा को मोंगोडब (बाइनरी डेटा, मेटाडेटा इत्यादि) में स्टोर कर सकते हैं, और उसके बाद लुसीन में अपने दस्तावेज़ों के सादे पाठ को इंडेक्स कर सकते हैं। या, यदि आपका उपयोग केस शुद्ध पूर्ण पाठ खोज है, तो आप केवल मोंगोडब के बजाय लोचदार खोज का उपयोग करने पर विचार कर सकते हैं।

अपडेट (अप्रैल 2013): मोंगोडीबी 2.4 अब मूलभूत पूर्ण-पाठ अनुक्रमणिका का समर्थन करता है! नीचे कुछ उपयोगी संसाधन।

http://docs.mongodb.org/manual/applications/text-search/

http://docs.mongodb.org/manual/reference/command/text/#dbcmd.text

http://blog.mongohq.com/blog/2013/01/22/first-week-with-mongodb-2-dot-4-development-release/

+1

MongoDB 2.4 अब पूर्ण टेक्स्ट खोज का समर्थन करता है। –

+0

सच है। मुझे लगता है कि मुझे इसे अपडेट करना चाहिए। –

+1

मोंगोडीबी 2.6 अब अपने नियमित क्वेरी ऑपरेटर के हिस्से के रूप में पूर्ण पाठ खोज है (2.4 तक, आपको db.runCommand का उपयोग करना था)। हालांकि, आप किसी ग्रिडफ फ़ाइल के अंदर किसी भी तरह की खोज नहीं कर सकते हैं। वे सिर्फ द्विआधारी भाग हैं और मोंगो उनके साथ अलग-अलग व्यवहार नहीं करेंगे अगर वे एक छवि के कुछ हिस्सों या पाठ्य पुस्तक के अध्याय हैं। – amenadiel

0

मोंगोडीबी एपीआई का उपयोग नहीं कर रहा, न कि मुझे पता है। ग्रिडएफएस designed to be more like a simplified file system एपीआई के साथ प्रतीत होता है जो एक सीधा कुंजी-मूल्य अर्थपूर्ण प्रदान करता है। उनके project ideas पृष्ठ पर वे दो चीजें हैं जो आप में मदद मिलेगी सूची अगर उत्पादन के लिए तैयार राज्य में ही अस्तित्व में:

  • GridFS FUSE कि आप GridFS स्थानीय फाइल सिस्टम के रूप में सूचकांक जैसे आप पर सूचकांक सामान होगा माउंट और उसके बाद करने की अनुमति होगी आपके डिस्क
  • लुसीन और Solr जैसे उपकरणों के साथ रीयल-टाइम पूर्ण पाठ खोज एकीकरण। गीथब और bitbucket पर कुछ परियोजनाएं हैं जिन्हें आप देखना चाहते हैं।

ElasticSearch पर भी देखें। मैंने some integration with Mongo देखा है, लेकिन मुझे यकीन नहीं है कि to tap into the GridFS (ग्रिडएफएस अनुलग्नक समर्थन का उल्लेख किया गया है लेकिन मैंने निश्चित रूप से यह जानने के लिए इसके साथ काम नहीं किया है)। हो सकता है कि आप इसे बनाने के लिए एक हों और फिर इसे खोलें? एक मजेदार साहसिक होना चाहिए

+1

GridFS फ्यूज बुरी पुरानी हो चुकी है। –

संबंधित मुद्दे