2013-01-23 18 views
5

मैं एक समाचार वेबसाइट के लिए काम करता हूं जो उनकी सभी कहानियों को एक्सएमएल के रूप में संग्रहीत करता है। मुझे पता है, जाने का सबसे अच्छा तरीका नहीं है, लेकिन यह वही है। मैं जो करने की कोशिश कर रहा हूं वह वेबसाइट से एक्सएमएल फाइलों के माध्यम से खोजना संभव बनाता है। अभी हमारी खोज सुविधा सभी Google संचालित है (यह केवल वही खोजता है जो Google पहले ही क्रॉल हो चुका है)।एक्सएमएल फाइलों को खोजना या अनुक्रमण करना

मैं बैट से सीधे क्या सोच रहा हूं, जीईपी का उपयोग करना है, जो कि तरह के काम ठीक है, लेकिन शायद बहुत अधिक पैमाने पर नहीं होगा। दूसरा विकल्प जो बहुत अधिक काम करेगा, लेकिन बेहतर तरीके से काम करेगा, एक्सएमएल के कुछ हिस्सों को एक रिलेशनल डेटाबेस में स्टोर करना है।

हमारे बैकएंड की स्थापना के तरीके को देखते हुए, एक अलग भंडारण मॉडल में जाने में काफी समय लगेगा, इसलिए समय के लिए, हमें यही काम करना है। विचार?

उत्तर

3

कुछ कैशिंग जोड़ने से आपको grep विचार को स्केल करने में मदद मिल सकती है। हालांकि, आप ऐसे समाधान पर विचार कर सकते हैं जो आज बैंड को समस्या की सहायता नहीं करेगा बल्कि कल आपको एक बेहतर समाधान के करीब ले जाएगा। हो सकता है कि एक बेहतर समाधान तैयार करना और समय के साथ टुकड़े टुकड़े को कार्यान्वित करना चाल चलाना होगा।

0

यदि आप एक्सएमएल का उपयोग करने के लिए प्रतिबद्ध हैं तो मैं एक मूल एक्सएमएल डेटाबेस समाधान जैसे बर्कले डीबीएक्सएमएल या ईएक्सिस्ट-डीबी को नियोजित करने का सुझाव दूंगा। वे दोनों आपको xqueries में आग लगाने की अनुमति देते हैं। ईएक्सिस्ट भी पूर्ण टेक्स्ट खोज को लागू करता है जो डीबीएक्सएमएल नहीं करता है, हालांकि बाद वाला डेटा पुनर्प्राप्त करने में तेज़ है।

1

मैं बेसएक्स (.org) जैसे एक्सएमएल डेटाबेस सिस्टम का उपयोग करने का भी सुझाव दूंगा, क्योंकि यह वास्तव में तेज़ है। मैं प्रत्येक लेख को एक अलग फ़ाइल में संग्रहीत करने का सुझाव दूंगा। बेसएक्स XQuery 3.0 के साथ-साथ पूर्ण पाठ, अद्यतन सुविधा का समर्थन करता है ...

संबंधित मुद्दे