2011-05-23 30 views
8

के शीर्ष पर हाइव चलाने के लिए पायथन क्लाइंट समर्थन मैंने देखा है कि न तो mrjob और न ही बोटो अमेज़ॅन लोचदार MapReduce (ईएमआर) पर हाइव नौकरियां जमा करने और चलाने के लिए एक पायथन इंटरफ़ेस का समर्थन करता है। क्या कोई अन्य पायथन क्लाइंट लाइब्रेरी है जो ईएमआर पर चल रहे हाइव का समर्थन करता है?अमेज़ॅन ईएमआर

उत्तर

9

Boto के साथ आप कुछ इस तरह कर सकते हैं:

args1 = [u's3://us-east-1.elasticmapreduce/libs/hive/hive-script', 
     u'--base-path', 
     u's3://us-east-1.elasticmapreduce/libs/hive/', 
     u'--install-hive', 
     u'--hive-versions', 
     u'0.7'] 
args2 = [u's3://us-east-1.elasticmapreduce/libs/hive/hive-script', 
     u'--base-path', 
     u's3://us-east-1.elasticmapreduce/libs/hive/', 
     u'--hive-versions', 
     u'0.7', 
     u'--run-hive-script', 
     u'--args', 
     u'-f', 
     s3_query_file_uri] 
steps = [] 
for name, args in zip(('Setup Hive','Run Hive Script'),(args1,args2)): 
    step = JarStep(name, 
        's3://us-east-1.elasticmapreduce/libs/script-runner/script-runner.jar', 
        step_args=args, 
        #action_on_failure="CANCEL_AND_WAIT" 
        ) 
    #should be inside loop 
    steps.append(step) 
# Kick off the job 
jobid = EmrConnection().run_jobflow(name, s3_log_uri, 
            steps=steps, 
            master_instance_type=master_instance_type, 
            slave_instance_type=slave_instance_type, 
            num_instances=num_instances, 
            hadoop_version="0.20") 
+0

कि काम किया - धन्यवाद unthingable करने के लिए! – poiuy

+0

मुझे VALIDATION_ERROR के कारण एमआर समाप्त हो रहा है .. कोई विचार? – vks

संबंधित मुद्दे