तो मेरी इनपुट डेटा दो क्षेत्रों/स्तंभ हैं: ID1 & आईडी 2, और मेरे कोड निम्नलिखित है:स्केलिंग: समूह के बाद, अन्य फ़ील्ड को कैसे बनाए रखें ('फ़ील्ड) {। Size}?
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
में उत्पादन परिणाम (मैं क्या मान) दो क्षेत्रों: आईडी 2 * आकार। मैं यह पता लगाने के लिए थोड़ा फंस गया हूं कि आईडी 1 मान को बनाए रखना संभव है जिसे आईडी 2 के साथ समूहीकृत किया गया था और इसे किसी अन्य क्षेत्र के रूप में जोड़ा गया था?
कृपया देखें कि क्या यह समझ में आता है, मुझे एक ही दर्द महसूस होता है। http://stackoverflow.com/questions/25994879/scalding-flatten-fields-after-groupby – Sergey