2012-09-14 17 views
13

मैं वर्तमान में एक सुअर स्क्रिप्ट डिबग कर रहा हूं। मैं सीधे पिग फ़ाइल में एक ट्यूपल परिभाषित करना चाहता हूं (मूल "लोड" फ़ंक्शन के बजाय)।सुअर स्क्रिप्ट में ट्यूपल डेटा को परिभाषित करें

क्या ऐसा करने का कोई तरीका है?

मैं ऐसा ही कुछ देख रहा हूँ:

A= ('name#bob'','age#29';'name#paul','age#12') 

डंप वापसी करेंगे:

('bob',29) 
('paul',12) 
+0

यदि आपने कुछ डेटा लोड किया है तो आप TOTUPLE का उपयोग कर tuples बना सकते हैं: http://pig.apache.org/docs/r0.10.0/func.html#totuple –

+2

मैं बस किसी भी लोड का उपयोग किए बिना एक ट्यूपल को परिभाषित करना चाहता हूं कार्य करता है। –

+0

आप एक% स्क्रिप्ट के साथ एक सुअर स्क्रिप्ट में पैरामीटर को परिभाषित कर सकते हैं, लेकिन मुझे नहीं लगता कि आपको फ्लाई पर कुछ डेटा बनाने की अनुमति है (इसे hdfs/local disk से लोड किए बिना) –

उत्तर

4

यह वास्तव में impossibble इस सुअर में क्या करना है के रूप में यह वर्तमान में खड़ा है। यदि आप बस हडूप में एक फाइल बनाने और इसे लोड करने के लिए डीबग करना चाहते हैं। उस फ़ाइल को लिखें जिसे आप फ़ाइल में चाहते हैं (जो कुछ भी आपने मैन्युअल रूप से बनाया होगा वह इसे संभव था) और इसे अपलोड करें। फिर सुअर का उपयोग करके इसे लोड करें।

1

निम्नलिखित (गंदा) चाल नौकरी करती है: - एक फ़ाइल बनाएं एक खाली पंक्ति उत्तर के साथ इसे अपने एचडीएफएस में स्टोर करें। - इसे लोड करें: लाइन = लोड/उपयोगकर्ता/toto/onelinefile उपयोग .. - अपने डेटा बनाएं: foreach लाइन नाम के रूप में 'बॉब' उत्पन्न करती है, 22 वर्ष के रूप में;

संबंधित मुद्दे