यह आप जो चाहते हैं उस पर निर्भर करता है। उदाहरण के लिए, क्या आप इतिहास के पृष्ठों, या सिर्फ यूआरएल के लिए वास्तविक डेटा स्टोर करना चाहते हैं? अगर किसी ने दो बार एक पृष्ठ का दौरा किया है, तो क्या इसे इतिहास में दो बार दिखाना चाहिए?
एक हैश नक्शा उपयुक्त हो अगर आप एक पेज के लिए डाटा स्टोर करना चाहता था, और केवल एक बार दिखाने के लिए प्रत्येक पृष्ठ चाहता था होगा।
हैं, के रूप में मैं अधिक होने की संभावना पर विचार कर रहे हैं, आप केवल यूआरएल संग्रहीत करना चाहते हैं, लेकिन प्रत्येक संग्रहीत कई बार अगर यह एक बार से अधिक का दौरा किया था, एक सरणी/वेक्टर शायद और अधिक समझ बनाने जाएगा चाहते हैं। यदि आप (अपेक्षाकृत) लंबे यूआरएल के बहुत से डुप्लिकेशंस को देखने की उम्मीद करते हैं, तो आप यूआरएल का एक सेट बना सकते हैं, और प्रत्येक विज़िट के लिए प्रश्न में यूआरएल के कुछ प्रकार के पॉइंटर/इंडेक्स/संदर्भ स्टोर करते हैं। नोट, हालांकि, यह बनाए रखना कुछ हद तक गैर-तुच्छ हो सकता है।
स्रोत
2011-06-13 19:52:00
मैं भी एक ही दिशा में सोच रहा था (का दौरा किया पृष्ठों की संख्या पर निर्भर करता है)। यह एक कुशल समाधान की तरह लगता है। मदद के लिये शुक्रिया ! – Karthik
आपका बहुत स्वागत है! –
यह कार्तिक की अपेक्षाओं को बिना किसी कार्यवाही आवश्यकता के किसी भी विचार के पुनर्जन्म देता है - केवल एक ही है, और बहुत यथार्थवादी नहीं है, लेकिन: "इसे पहले दिन के सबसे अधिक देखी जाने वाले पृष्ठों और अगले दिन के सबसे अधिक देखी जाने वाले पृष्ठों को दिखाना चाहिए और इसलिए पर"। हैश मैप्स को सॉर्ट नहीं किया गया है, और यूआरएल पर आपका कुंजी है - आप सबसे ज्यादा देखे गए पेज को कैसे ढूंढेंगे? ब्रूट फोर्स इटेशन, जो हैश मैप के लिए आमतौर पर वेक्टर पुनरावृत्ति से धीमा होता है। हैश मानचित्र तेजी से इंट्राडे अपडेट की अनुमति देते हैं, लेकिन बाहरी हैश मैप का उपयोग क्यों करते हैं जब एन के सरणी/वेक्टर बेहतर कॉम्पैक्ट और तेज़ होते हैं? –