2009-11-10 19 views
5

ठीक है, मैं पूरी तरह से एसओएलआर और लुसीन के लिए नया हूं, लेकिन सोलर को टॉमकैट 6.x के तहत आउट-ऑफ-द-बॉक्स चला रहा है और कुछ बुनियादी विकी प्रविष्टियों में से कुछ खत्म हो गया है।वेब परियोजनाओं के साथ एसओएलआर का उपयोग करने के लिए सबसे अच्छा तरीका क्या है?

मेरे कुछ प्रश्न हैं, और कुछ सुझावों की भी आवश्यकता है।

  1. सोलर फ़ाइलों (एक्सएमएल, सीएसवी) में डेटा इंडेक्स कर सकता है और यह डीबी को भी इंडेक्स कर सकता है। क्या आप इसे यूआरआई/डोमेन पर भी इंगित कर सकते हैं, और क्या यह Google की तरह एक वेबसाइट को इंडेक्स कर सकता है?

  2. यदि मेरे पास "पेज" डेटा वाली वेबसाइट है, तो "पृष्ठ नाम", "पृष्ठ सामग्री" आदि, और "उत्पाद डेटा", इसलिए "उत्पाद का नाम", "एसकेयू" आदि, क्या मुझे दो अलग-अलग की आवश्यकता है Schema.xml फाइलें? और यदि हां, तो क्या इसका मतलब सोलर के दो अलग-अलग उदाहरण हैं?

अंत में, यदि आप एक बड़े संबंधपरक और सामान्यीकृत डेटाबेस के साथ एक परियोजना, आप क्या कहेंगे ?:

  1. नीचे 3 विकल्पों में से सबसे अच्छा तरीका है एक मध्यस्थ सेवा में चल रहा है पृष्ठभूमि, जो डीबी को खनन करती है और मैन्युअल रूप से प्रासंगिक एक्सएमएल फाइलें बनाता है ताकि एसओएलआर

  2. एसओएलआर सीधे डीबी को इंडेक्स करें। इस मामले में, क्या एसओएलआर को विचारों को इंगित करना सबसे अच्छा होगा, जो कि सभी तालिका संबंधों को अमूर्त करेगा?

  3. कोई अन्य विकल्प जो मुझे अनजान है?

प्रसंग: हम .NET 3.5 SQLServer एक Windows 2003 वातावरण में चला रहे हैं,, 2005/2008

चियर्स!

उत्तर

7
  1. नहीं, आपको इसके लिए क्रॉलर चाहिए, उदा। Nutch
  2. हां, आप दो अलग-अलग इंडेक्स (= दो schema.xml) चाहते हैं क्योंकि डेटासेट से संबंधित प्रतीत नहीं होता है। इसका मतलब सोलर के दो उदाहरण नहीं हैं, आप Cores के साथ दो इंडेक्स प्रबंधित कर सकते हैं।

सोलर इंडेक्स को पॉप्युलेट करने के लिए, यह आपकी विशेष परियोजना पर निर्भर करता है, उदाहरण के लिए, क्या यह पुरानी डेटा को सहन कर सकता है या इसे बिल्कुल ताजा करना है।

सूचकांक आंकड़ों के अन्य विकल्पों में शामिल हैं: यदि आप उपयोग कर रहे हैं ORM किसी प्रकार अपनी अवरोधन क्षमताओं का उपयोग

  • डाटाबेस से चलाता है
  • । उदाहरण के लिए आप अद्यतन, सम्मिलित या हटाए गए इंडेक्स को अपडेट करने के लिए एनएचबीर्नेट घटनाओं का उपयोग कर सकते हैं। आप NHibernate का उपयोग करें और SolrNet यदि यह taken care of automatically
+0

+1 धन्यवाद मॉरीसिओ, यह वास्तव में उपयोगी है। मुझे आश्चर्य है कि क्या आप संभवतः एक बिंदु पर थोड़ा सा विस्तार कर सकते हैं। पुराने और ताजा आंकड़ों के संदर्भ में, मैं किस डेटा स्रोत का उपयोग करता हूं इससे कोई फर्क नहीं पड़ता? केवल मैं कितनी बार परिवर्तन करता हूं ... मानते हैं कि सभी प्रतिबद्धताएं (जोड़/अपडेट/हटाएं) मैन्युअल रूप से सही होनी चाहिए? सोलरनेट के लिए, क्या मुझे एसओएलआर के साथ मैन्युअल रूप से संचार के बारे में चिंता करने की ज़रूरत नहीं है? डेटा ताजगी के बारे में फिर से धन्यवाद – andy

+1

: यह डेटा के * उपयोगकर्ता * (उपभोक्ता) पर निर्भर करता है। यदि उपभोक्ता को हमेशा * अद्यतित डेटा देखने की आवश्यकता होती है जो ऑफ़लाइन/पृष्ठभूमि अनुक्रमण विधियों को रद्द कर देगी और आपको ट्रिगर्स या ओआरएम अवरोध जैसे कुछ प्रतिक्रियाशील के साथ जाना होगा। बेशक, जब वेबपृष्ठों को अनुक्रमणित करते हैं तो आपको कोई "ट्रिगर्स" नहीं मिलता है, आपका एकमात्र विकल्प क्रॉलर होता है। हां, सोलरनेट हैंडल .NET <-> सौर संचार। –

+0

@ मॉरीसियो: धन्यवाद आदमी। हम अपनी साइट बनाने के लिए कस्टम सीएमएस का उपयोग करते हैं। तो, क्या यह एक बुद्धिमान निर्णय होगा क्या आपको लगता है कि जब भी पेज/उत्पाद सीएमएस में संपादित किए जाते हैं तो एक्सएमएल के माध्यम से सोलर को अद्यतन/हटाएं? इसके अलावा हम NHybernate का उपयोग नहीं करते हैं, इसलिए मुझे लगता है कि SolrNet को कोई लाभ नहीं है। धन्यवाद, यह वास्तव में सहायक है – andy

1

है मुझे लगता है कि मौरिसियो उनकी सलाह के लिए पर मर चुका है। एकमात्र बिंदु जो मैं करूँगा वह यह है कि "मिडलवेयर" इंडेक्सर का निर्णय लेने पर, या सीधे डेटाबेस का उपयोग करें। यदि आपका डेटाबेस (या विचार?) नक्शा बहुत अच्छी तरह से है जो एक अच्छा सोलर स्कीमा चाहता है, तो DIH बहुत अच्छा है।लेकिन, यदि आप डेटा के कई स्रोतों से अनुक्रमणित कर रहे हैं, या यदि आपको अपने डेटाबेस में डेटा के बारे में जानकारी मिलनी है जो कि सोलर चाहेगा, तो एक समर्पित मिडलवेयर इंडेक्सर बेहतर है।

+0

और "मृत पर" से, मेरा मतलब बहुत सटीक है! बस अगर कोई उलझन में था! –

+0

शांत, अतिरिक्त सलाह एरिक के लिए धन्यवाद। मैं बस सोच रहा था कि क्या मिडलवेयर सिर्फ पूरी तरह बेवकूफ था, लेकिन मुझे लगता है कि यह एक पर्यावरण में समझ में आता है, जहां आप कहते हैं, डेटा स्रोत भिन्न हैं। चियर्स! +1 – andy

संबंधित मुद्दे

 संबंधित मुद्दे