मैं स्क्वाप संस्करण 1.4.2 और ओरेकल डेटाबेस का उपयोग कर रहा हूं।स्क्वाप आयात और निर्यात चलाने पर मैपर्स की इष्टतम संख्या कैसे प्राप्त करें?
Sqoop कमांड चलाते समय। इस तरह उदाहरण के लिए: - कितने समानांतर कार्य हम Sqoop चलाना चाहते हैं (यह भी वे डाटाबेस एक ही समय में पहुँचने के किया जा सकता है)
./sqoop import \
--fs <name node> \
--jt <job tracker> \
--connect <JDBC string> \
--username <user> --password <password> \
--table <table> --split-by <cool column> \
--target-dir <where> \
--verbose --m 2
हम --m निर्दिष्ट कर सकते हैं। एक ही विकल्प> ./sqoop निर्यात < ... के लिए उपलब्ध है
वहाँ कुछ अनुमानी अनुमान लगाना कार्य का इष्टतम संख्या का उपयोग करने के क्या है में मदद मिलेगी जो (शायद डेटा के आकार के आधार पर) है?
धन्यवाद!
नहीं, यह आपके डेटाबेस सर्वर के CPUs/कोर की संख्या पर निर्भर करता है, डिस्क की मात्रा प्रत्येक कार्य की आवश्यकता होगी, उन डिस्क की गति, रैम में प्रत्येक कार्य का कितना प्रदर्शन किया जा रहा है, राशि रैम की, जो आप राम में स्टोर नहीं कर सकते हैं, आपके द्वारा उपयोग की जाने वाली फाइल सिस्टम, डेटाबेस के विपरीत ओएस को असाइन की गई रैम की मात्रा, संभावित रूप से आपके स्विच और नेटवर्क केबल्स का आकार और डेटाबेस और/या सर्वर के खिलाफ अतिरिक्त प्रक्रियाओं की संख्या चल रही है और कैसे उपर्युक्त कारक उन्हें प्रभावित करते हैं, आदि। इसका परीक्षण करें। – Ben
@Ben - मैं इसे उत्तर के रूप में सबमिट करूंगा –