पार्सिंग मैं लाखों पंक्तियों (5 टीबी + टेबल) के लिए नेस्टेड JSON से कुछ मान प्राप्त करने का प्रयास कर रहा हूं। ऐसा करने का सबसे प्रभावी तरीका क्या है?हाइव: JSON
{"country":"US","page":227,"data":{"ad":{"impressions":{"s":10,"o":10}}}}
मैं ऊपर JSON से बाहर इन मूल्यों की आवश्यकता:
Country Page impressions_s impressions_o
--------- ----- ------------- --------------
US 2 10 10
यह हाइव के json_tuple समारोह है, मुझे यकीन है कि अगर यह सबसे अच्छा कार्य है नहीं कर रहा हूँ
यहाँ एक उदाहरण है। https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-getjsonobject