2009-01-06 8 views
10

मैं कल एक सहकर्मी के साथ एक परिस्थिति के बारे में बात कर रहा था जहां उसने एसएसआईएस (या ऐसा कुछ) एसएसआईएस पैकेज के साथ कुछ वाकई अच्छी चीज करने के लिए इस्तेमाल किया था, जहां उन्होंने "डॉ रेजिनाल्ड विलियम्स, पीएचडी" जैसे नाम में पारित किया था। और कुछ भारोत्तोलन योजना के आधार पर प्रणाली यह समझने के लिए पर्याप्त समझदार थी कि इसे कैसे टोकननाइज़ किया जाए और डेटाबेस में इसे "अभिवादन - पहला नाम - अंतिम नाम - प्रत्यय" के रूप में संग्रहीत किया जाए। उन्होंने बीआई, और एसएसआईएस, ईटीएल, और डेटा खनन जैसे कुछ buzzwords बाहर फेंक दिया। मैं वास्तव में और जानकारी चाहता था, लेकिन यह भी नहीं पता था कि कहां से पूछना शुरू करना है।क्या कोई डेटा खनन, एसएसआईएस, बीआई, ईटीएल और अन्य संबंधित प्रौद्योगिकियों को समझा सकता है?

मैं एक नेट डेवलपर हूं और सी #, वीबी.Net, WPF, आदि में पूरी तरह से ज्ञात हूं ..., लेकिन मुझे नहीं पता कि ये तकनीकें क्या हैं, उन्हें अपने कौशल सेट में कैसे जोड़ना है, और क्या या ऐसा कुछ नहीं है जिस पर मुझे वास्तव में ध्यान केंद्रित करना चाहिए। कोई और सभी दिशा सहायक होगी।

उत्तर

21

एसएसआईएस == एसक्यूएल सर्वर एकीकरण सेवाएं और यह एक है ट्रांसफॉर्म और लोड (ईटीएल) टूल निकालें, यह एसक्यूएल 7, एसक्यूएल 2 के युग में डाटा ट्रांसफॉर्मेशन सर्विसेज या डीटीएस क्या था, यह एक बेहतर उपकरण है। यह एक अच्छा टूल है वर्कफ़्लो प्रक्रियाओं को व्यक्त करना जिसमें डेटा को बिंदु ए से बिंदु बी (और सी और डी इत्यादि) में स्थानांतरित किया जाता है और उस प्रक्रिया के माध्यम से परिवर्तनों से गुजरता है जैसे कि एक डिमॉर्मलाइज्ड डिज़ाइन या डेटा सफाई के लिए समेकन।

बीआई या बिजनेस इंटेलिजेंस तकनीकी दुनिया में एक पूरी श्रेणी के लिए एक मोनिकर है और यह अभी एक महान जगह है। बीआई कौशल बहुत मूल्यवान और आने के लिए कठिन हैं, कारणों में से एक कारण यह है कि एक प्रयोगशाला में एक वास्तविक बीआई मामले को फिर से बनाना मुश्किल है, इसलिए शिक्षण हमेशा वास्तविक दुनिया की स्थिति में किया जाता है।

उच्च स्तर से, बीआई परियोजनाओं में आमतौर पर रिपोर्टिंग का अंत बिंदु शामिल होता है। अक्सर डेवलपर्स के रूप में हम पीओ के विवरण जैसे लेनदेन संबंधी रिपोर्ट लेखन के लिए उपयोग किए जाते हैं लेकिन बीआई बहुत व्यापक रिपोर्ट में आ सकता है जो दशकों से उत्पाद बिक्री के रुझान को कवर करता है और लाखों रिकॉर्डों से निपटता है। जिस तरह से हम अनुप्रयोगों के लिए डेटाबेस तैयार करते हैं, इस तरह की रिपोर्टिंग के लिए आदर्श नहीं है, इसलिए अन्य टूल्स और तकनीकों का आविष्कार किया गया और बीआई स्पेस में इसका उपयोग किया जाता है। ये क्यूब्स जैसी चीजें हैं जिन्हें आप अक्सर ओलाप क्यूब्स कहते हैं। ओलाप क्यूब्स आमतौर पर डेटा वेयरहाउस से निकलते हैं जो किसी अन्य डेटाबेस से अधिक कुछ नहीं है - लेकिन सामान्य गोदामों में डेटा एक से अधिक होता है, और अक्सर अन्य अनुप्रयोग डेटाबेस के दर्जनों होते हैं। आपका इन्वेंट्री ऐप, क्रय ऐप, एचआर ऐप और दूसरों के पूरे समूह में सभी बिट्स और डेटा के टुकड़े होते हैं जो व्यवसाय की पूरी तस्वीर बनाते हैं, एक बीआई आर्किटेक्ट एसएसआईएस की तरह कुछ इन सिस्टमों से डेटा खींचने के लिए उपयोग करेगा, इसे मालिश करें और इसे डेटा वेयरहाउस में संग्रहीत करें जो रिपोर्टिंग के लिए एक अलग तरह के डिज़ाइन के साथ डिज़ाइन किया गया है। एक बार यह गोदाम में है, वह उस डेटा पर क्यूब्स बनाने के लिए विश्लेषण सेवाओं का उपयोग करेगा और रिपोर्टिंग सेवाओं की तरह कुछ आपको उस डेटा पर रिपोर्ट दिखाने के लिए करेगा।

संपादित करें: क्षमा करें, डेटा खनन भूल गया, यह एक और गैर-विशिष्ट शब्द है जो वर्णन और अवधारणा या प्रक्रिया है और इतना अधिक उपकरण नहीं है। एक साधारण उदाहरण में, यह डेटा में पैटर्न की पहचान करने के लिए एक विधिवत दृष्टिकोण है।अतीत में एक अच्छा व्यापार analysy प्रवृत्तियों के लिए लेकिन आधुनिक डेटाबेस आप डेटासेट रास्ता बहुत बड़ी मैन्युअल के माध्यम से कंघी करने के बारे में बात कर रहे हैं के साथ डेटा के माध्यम से देखना होगा - डाटा खनन आपको लगता है कि डेटा के माध्यम से कंघी और पैटर्न है कि ब्याज की हैं की पहचान करने के लिए कंप्यूटर को निर्देश देने की अनुमति देता है ।

आशा है कि

2

एसएसआईएस SQL Server Integration Services है और ईटीएल (निकालें, ट्रांसफॉर्म, और लोड) करने के लिए उपयोगी है जो कई डेटा वेयरहाउसिंग/business intelligence समाधानों का फ्रंट एंड है जो आंकड़ों को आसानी से उपयोग करने वाले आयामी मॉडल में एकीकृत करता है। एसएसआईएस छोटे परियोजनाओं के लिए भी विरासत डेटा या अन्य भंडारों या फ़ाइलों से डेटा लोड करने के सुविधाजनक तरीके के रूप में उपयोगी है।

Data mining आमतौर पर जानकारी है कि (लेन-देन संबंधी आंकड़ों से स्पष्ट नहीं किया जाएगा डेटा के लिए और अधिक "आयाम" दे रही है कई स्रोतों के एकीकरण के माध्यम से अनुमान लगाने के लिए एकीकृत स्रोतों से डेटा का उपयोग कर निकलता है।

बीआई एक बहुत बड़ा विषय है इसलिए जब तक आप उस क्षेत्र में नहीं जाना चाहते हैं, तब तक यह ध्यान केंद्रित करने के लिए कुछ नहीं हो सकता है, लेकिन एसएसआईएस छोटी परियोजनाओं पर उपयोगी हो सकता है और किसी भी घटना में सीखने लायक है।

3

अपने सहकर्मी बेहतर एक स्ट्रिंग की "बुद्धिमान पद व्याख्या" के रूप में वर्णित किया जा सकता है किया क्या मदद करता है। यह परिष्कार के कई स्तरों पर किया जा सकता है - उदाहरण के लिए, सांख्यिकीय मॉडल का उपयोग करके आपको संभावना है कि "डॉ" एक अभिवादन है और पहला नाम नहीं है। या यह सामान्य नमस्कारों की एक साधारण लुकअप सूची का उपयोग कर सकता है, इस मामले में यह केवल नियमित प्रक्रियात्मक कोड है, और कुछ भी नहीं।

लघु उद्योगों एसक्यूएल सर्वर एकता सेवा के लिए कम है। यह मूल रूप से स्टेरॉयड पर DTS है; कुछ लोग इसे प्यार करते हैं, और कुछ लोग इसे नफरत करते हैं। यह उस चीज को करने के लिए खुद को उपयोग करना मुश्किल होगा जिसके बारे में आप बात कर रहे हैं; यह मुख्य रूप से केवल विभिन्न स्रोतों से डेटा लेने और इसे संयोजित करने, इसे बदलने, और इसे कहीं और लोड करने के लिए है। यह कुछ गंधा बातें, जिनमें से कई की तरह डाटा माइनिंग हो जाते हैं कर सकते हैं, लेकिन अंत में यह डेटा एक ही दिशा से या किसी अन्य cramming के लिए एक उत्पादन उपकरण है। यह डेटा खनन समुदाय में विशेष रूप से सम्मानित नहीं है।

Data Mining एक संपूर्ण अकादमिक अनुशासन है, जो भविष्य में उत्तरों की भविष्यवाणी करने या मौजूदा डेटा में पैटर्न को बेहतर ढंग से समझने के लिए कुछ (आमतौर पर बड़ी) मात्रा डेटा का उपयोग करने पर केंद्रित है। यह निश्चित रूप से प्रवेश करने के लिए एक महान क्षेत्र है, लेकिन कुछ ऐसा नहीं है जिसे आप गणित और एल्गोरिदम के कुछ गहन अध्ययन के बिना उठा सकते हैं और कर सकते हैं। विषय पर एक अच्छी किताब this one है।

"व्यापार खुफिया" एक विशिष्ट तकनीक की तुलना में एक मूलमंत्र की वास्तव में अधिक है, और अलग अलग लोगों को अलग अलग बातें हो सकता है। आधार पर, विचार व्यापार डेटा के साथ कम गूंगा सामान करने का सुझाव देता है, और आम तौर पर यह समय के साथ रुझानों का विश्लेषण करता है, अक्सर ओलाप का उपयोग करता है। इसमें डेटा खनन या एआई एल्गोरिदम भी शामिल हो सकते हैं, लेकिन चूंकि कोई कठोर परिभाषा नहीं है, केवल किसी के बारे में जो आपको कुछ बेचना चाहता है, आपको बताएगा कि यह "बिजनेस इंटेलिजेंस" प्रदान करता है, और उम्मीद है कि आप आगे नहीं खोलेंगे।

0

इन सभी "नए" शब्दों का कारण वास्तव में दुनिया में डेटा की तेज़ी से तेजी से (घातीय) बढ़ रहा है। बीआई (Wikipage) दृढ़ता से शब्द "डाटा गोदाम" (यह बीआई प्रक्रियाओं के भीतर केंद्रीय इकाई है) के साथ ही शब्द "डाटा माइनिंग" के साथ जुड़ा हुआ है।
ETLs पर अधिक। मैं केवल इतना जोड़ूंगा कि एसएसआईएस माइक्रोसॉफ्ट का एक उत्पाद है, लेकिन कई अन्य ईटीएल उपकरण हैं, सबसे प्रसिद्ध हैं: इनफॉर्मेटिका, पेंटाहो, आईबीएम के इंफोस्फीयर सूचना सर्वर, ओरेकल के डेटा इंटीग्रेटर और टैलेंड इत्यादि। ईटीएल अक्सर भी लिखे जाते हैं कोई प्रोग्रामिंग भाषा (हम उन्हें पायथन और यहां तक ​​कि गोलांग में भी थे)।

संबंधित मुद्दे