5

जब मैं एक बार फिर से SQL कथन से डेटा खींचता हूं, तो मुझे लगता है कि वे SQL का उपयोग नहीं करते हैं, बल्कि, आयाम और मेट्रिक्स और उनके संयोजनों का उपयोग करते हैं।Google Analytics जैसे वेब Analytics SQL कथन के बजाय आयाम और मीट्रिक का उपयोग क्यों करते हैं?

इसका कारण क्यों है? मुझे लगता है कि इसमें एक एसक्यूएल इंटरफ़ेस नहीं है (या एक सादा वेब सर्वर लॉग डाउनलोड)? यदि हां, तो एसक्यूएल कथन कैसे आयाम, मेट्रिक्स (और सेगमेंट और फ़िल्टर) में अनुवाद करते हैं?

ऐसा लगता है कि इस तरह के मेट्रिक्स गणना () या औसत () के रूप में "समुच्चय" हो जाते हैं, और आयाम लॉग इन मूल्यों को अपने आप होने के लिए (ब्राउज़र जैसे आईई या देश == ऑस्ट्रेलिया == दिया जाता है), जो group by मानों के समान है। फ़िल्टर सशर्त की तरह है, और सेगमेंट के बारे में क्या?

ऐसा लगता है कि यदि हम आयाम निर्दिष्ट करते हैं, तो यह स्वचालित रूप से group by करता है और उस फ़ील्ड को भी प्रदर्शित करता है। यह आमतौर पर गणना करता है () या योग () आमतौर पर। अगर हम average(*) चाहते हैं तो क्या होगा? और क्या होगा यदि हम इसे दिखाना चाहते हैं लेकिन यह group by नहीं करना चाहते हैं? प्रयोग करने के लिए

उदाहरण वेबसाइट http://code.google.com/apis/analytics/docs/gdata/gdataExplorer.html

उत्तर

2

पर मैं कल्पना कर सकते हैं इस सवाल का जवाब यह है कि इससे पहले कि एपीआई उपलब्ध था एक ही तरीका है कि आप डेटा का विश्लेषण कर सकता है गूगल एनालिटिक्स इंटरफेस के माध्यम से था में निहित है। और वहां वे बड़े पैमाने पर "आयाम" और "मीट्रिक" का उपयोग करते हैं। चूंकि गैर-तकनीकी लोगों ने इसका बार-बार उपयोग किया, इसलिए उन्होंने कभी भी जटिल एसक्यूएल संरचनाएं शुरू नहीं की होंगी; ड्रॉपडाउन होने के साथ बस आसान है।

मुझे पूरी तरह से यकीन नहीं है कि Google Analytics डेटा संग्रहीत करने का तरीका एसक्यूएल अनुकूल है (यानी कॉलम और पंक्तियों से पंक्तियां)। मैंने पढ़ा है कि उन्होंने इस डेटा को संग्रहीत करने का अपना आंतरिक तरीका विकसित किया है।

+0

हाँ, हो सकता है कि वे कुछ मामलों में सभी विवरणों को संग्रहीत करने के बजाय डेटा का नमूना लें –

7

"आयाम" और "मेट्रिक्स" शब्द का उपयोग करने से पता चलता है कि Google एक संबंधपरक डेटाबेस के बजाय ओलाप डेटाबेस का उपयोग कर रहा है .... एसक्यूएल डेटाबेस के संबंध में उपयोग किया जाता है: ओएलएपी एमडीएक्स या मालिकाना क्वेरी भाषाओं (यदि ओरेकल) का उपयोग करता है ।

http://en.wikipedia.org/wiki/OLAP

किसी भी OLAP प्रणाली के मूल से एक OLAP क्यूब है (यह भी एक 'बहुआयामी घन' या एक hypercube कहा जाता है)।

यह संख्यात्मक उपायों जो आयाम द्वारा वर्गीकृत कर रहे हैं कहा जाता तथ्यों के होते हैं।

3

यह शायद आंतरिक रूप से बिग टेबल और मैप-रेड्यूस जैसी अपनी तकनीकों का उपयोग करके विकसित किया गया था। मैपिंग और एग्रीगेटिंग मैप-घटा प्रकार एल्गोरिदम की ताकत है, इसलिए यह समझ में आता है कि डेटा इस तरह के विभिन्न आयामों में समेकित होने वाला प्रतीत होता है।

आप उनके बारे में अधिक जानने के लिए मैं इन विकिपीडिया लेख सुझाव देंगे चाहते हैं:

3

मेरा अनुमान है अगर आप इस तरह एक सवाल पूछ रहे हैं, तो आप शायद कुछ अतीत के बॉक्स रिपोर्टों जैसे कि सरल पृष्ठ दृश्यों को देखकर बहुत पहले चले गए हैं। यदि आप बस इतना कर रहे हैं तो आप वेब एनालिटिक्स के बिंदु और शक्ति को काफी हद तक याद कर रहे हैं। सामान्य रूप से वेब एनालिटिक्स (न केवल जीए) समय के साथ डेटा में रुझानों को देखने के बारे में है। और डेटा को पूर्व-परिभाषित और उपयोगकर्ता परिभाषित दोनों नियमों और व्यवहारों का पालन करके अधिग्रहण किया जाता है।

रिपोर्ट के लिए अधिकांश डेटा सीधे डेटाबेस डेटाबेस से आसानी से नहीं पकड़े जा सकते हैं, क्योंकि डेटा "xyz over time" और समेकित डेटा जैसे सार तत्वों पर आधारित है। उदाहरण के लिए, आयामों और मीट्रिक के लिए "स्कोप" की अवधारणा, जहां एक चर और/या मान एकल पृष्ठ दृश्य/घटनाओं के बारे में डेटा या विज़िट (सत्र) के दौरान या उपयोगकर्ता द्वारा परिभाषित समय के दौरान डेटा की रिपोर्ट करेगा (जैसे "यह एक महीना आखिरी बनाओ" या "कुछ घटना होने तक यह आखिरी बनाओ," जैसे एक विशिष्ट चर या परिवर्तनीय प्रकार पॉप किया जा रहा है)।

क्योंकि रिपोर्टिंग के सबसे डेटा पुनर्प्राप्ति के उच्च स्तर अवधारणाओं शामिल है, डेटाबेस दूर निकाला जाता है, और एक "रूपरेखा" (रिपोर्ट इंटरफ़ेस) जगह में डाल दिया जाता है आप trended डेटा को दिखाने वाली रिपोर्ट निर्माण में मदद करने। यहां तक ​​कि यदि आप एक डेटाबेस विशेषज्ञ हैं, तो यह पृष्ठ दृश्यों जैसे सबसे बुनियादी डेटा को छोड़कर लगभग सभी चीज़ों के लिए मैन्युअल रूप से डेटा को आजमाने और निकालने का बहुत अधिक समय और प्रयास करेगा। और इस तरह का मूल डेटा बहुत ही क्रियाशील नहीं है।

उदाहरण के रूप में अभियान ट्रैकिंग को देखें। यह सब एक var = value के साथ शुरू होता है। जब कोई उपयोगकर्ता किसी लिंक पर क्लिक करता है और यूआरएल में उस var = value के साथ किसी पृष्ठ पर जाता है, तो ट्रैकिंग कोड उस मान को पकड़ता है और न केवल पृष्ठ के बारे में डेटा (यूआरएल, समय, ब्राउज़र का प्रकार, सूची चालू करता है) और चालू) लेकिन कस्टम कोडिंग से एकत्र किए गए सभी अन्य डेटा भी। फिर अन्य सेटिंग्स भी लागू हो सकती हैं, जैसे मूल्य-प्रति-क्लिक या कुछ भारित उपाय, लक्ष्य या घटना की ओर सफलता की विशेषता आदि ... अन्य नियमों (पहले बनाम अंतिम क्लिक एट्रिब्यूशन इत्यादि) के आधार पर। ..)। खेल में आने वाली चीजों की सूची और क्या माना जाता है, आगे और आगे चला जाता है। आगे बढ़ें और उन डेटाबेस क्वेरी को स्वयं स्ट्रिंग करने का प्रयास करें। अब धोएं, कुल्लाएं और दोहराएं क्योंकि यह सिर्फ एक अभियान कोड था। मेरे पास हजारों अभियान कोड वाले ग्राहक हैं, जिनमें हर दिन कई और जोड़े जा रहे हैं। ओह, और उस पर भी, वास्तविक रिपोर्ट को डेटा दिखाने के तरीके के आधार पर पूरी तरह से नए प्रश्नों को ट्वीक करना या बनाना। क्रॉस-रेफरेंसिंग और xyz द्वारा तोड़ना। उस डेटा के आधार पर फ़नल और परिदृश्य देख रहे हैं। और यह केवल अभियानों के लिए है, कई चीजों में से एक बात है।

तो एक लम्बी कहानी कम करने के लिए,, डेटाबेस के लिए एक रूपरेखा के रूप में एक रिपोर्ट इंटरफ़ेस के बारे में सोच पूर्वनिर्धारित प्रश्नों आप ठीक कर सकते हैं के साथ, लोगों की रिपोर्टिंग के प्रयासों में काफी आसान बनाने के लिए, खासकर जब से ज्यादातर लोगों डेटाबेस विशेषज्ञों नहीं हैं।

+3

अपनी वेबसाइट से प्यार करें। – Stann

1

हमने खुद को इसी तरह के प्रश्न पूछा। ऐसा लगता है कि कई वेब एनालिटिक्स एपीआई एक बाद के विचार से अधिक हैं और अक्सर संबंधित उत्पाद की यूआई विशेषताओं के लिए सीधे मैपिंग हैं। Infunl के साथ (अस्वीकरण: मैं एक सह-संस्थापक हूं) हम लचीली क्वेरी भाषा के साथ वेब एनालिटिक्स एपीआई बना रहे हैं जो सिंकैक्टिक रूप से एसक्यूएल के समान है, फिर भी समेकन के लिए अत्यधिक अनुकूल है और इसके पीछे निष्पादन ढांचे को कम करता है। इसके अलावा यह कई अंतर्निहित कार्यक्षमता प्रदान करता है जो विशेष रूप से वेब एनालिटिक्स के लिए डिज़ाइन किया गया है, जैसे रूपांतरण फ़नल चरण, समूह विश्लेषण, विभाजन परीक्षण और लचीली सामग्री समूह और विभाजन के लिए समर्थन।