की प्रतिलिपि किए बिना हाइव टेबल में डेटा आयात करना संभव है मेरे पास एचडीएफएस में टेक्स्ट के रूप में संग्रहीत लॉग फ़ाइलें हैं। जब मैं लॉग फ़ाइलों को एक हाइव टेबल में लोड करता हूं, तो सभी फ़ाइलों की प्रतिलिपि बनाई जाती है।क्या डेटा
क्या मैं अपने सभी टेक्स्ट डेटा को दो बार संग्रहीत करने से बच सकता हूं?
संपादित करें: मैं इसे निम्न आदेश के माध्यम से लोड
LOAD DATA INPATH '/user/logs/mylogfile' INTO TABLE `sandbox.test` PARTITION (day='20130221')
फिर, मैं में ठीक उसी फ़ाइल पा सकते हैं:
/user/hive/warehouse/sandbox.db/test/day=20130220
मैं इसे कॉपी किया गया था ग्रहण किया।
आप कैसे कहते हैं, इसकी प्रतिलिपि बनाई गई है? आप उन्हें हाइव टेबल में कैसे लोड करते हैं? –
मैं इसे 'लोड डेटा INPATH' xxx 'INTO तालिका yyy' के माध्यम से लोड करता हूं (पोस्ट संपादित देखें) तो मुझे फ़ाइल '/ user/hive/warehouse' में मिलती है। मैं सोच रहा हूं कि क्या यह वहां जा सकता है (मुझे लगता है कि मुझे अपनी निर्देशिका में विभाजन संरचना को लागू करना होगा लेकिन यह ठीक है) –
यह एचडीएफएस में कैसे संग्रहीत किया गया था? –