मैं एक वेब अनुप्रयोग विकसित कर रहा हूं और मैं दो तरह के सांख्यिकीय/मॉडलिंग संचालन करना चाहता हूं।वेब अनुप्रयोग में आर को एकीकृत करने के लिए कैसे करें
(1) मेरे ऐप (एचबीएस क्लस्टर) के बैकएंड में संग्रहीत डेटा से बैच विश्लेषण। आम तौर पर, इस ऑपरेशन को नियमित आधार पर किया जाना चाहिए, हर रात कहें। डेटा का आकार स्थानीय स्मृति में संग्रहीत किया जा सकता है, इसलिए इसे समांतर कंप्यूटिंग का समर्थन करने वाले कुछ पैकेजों के आमंत्रण की आवश्यकता हो सकती है। (2) फ्लाई आर निष्पादन पर फ्रंट एंड में उपयोगकर्ता अनुरोध द्वारा ट्रिगर किया गया। विशिष्ट उपयोग मामले में छोटी समय श्रृंखला का पूर्वानुमान शामिल है। उपयोगकर्ता एक ही समय में अनुरोध कर सकते हैं इसलिए सहमति के लिए कुछ समर्थन होना चाहिए। प्रदर्शन सबसे महत्वपूर्ण है क्योंकि उपयोगकर्ता आने वाली प्रतिक्रिया के लिए अनिश्चित काल तक इंतजार नहीं कर सकता है।
मेरा प्रश्न है: उन दो समस्याओं को हल करने के लिए प्रौद्योगिकियों/सीआरएएन पैकेज का सबसे अच्छा संयोजन क्या होगा? इस पल के लिए मेरा विचार है:
- रुबी क्लाइंट के साथ संयोजन में रूवर का उपयोग करना। वैकल्पिक रूप से, मैं जावा में सर्वर लिखने और मौजूदा आर/जावा बाइंडिंग का उपयोग करने के बारे में सोच रहा हूं।
- बड़े डेटासेट पर नौकरियों को संभालने के लिए RHadoop का उपयोग करना।
मैंने देखा कि RevoDeployR एक अच्छा टूल है लेकिन यह खुला स्रोत नहीं है, है ना?
आपकी मदद
आपके उत्तरों के लिए बहुत बहुत धन्यवाद। –