मैं नक्शा समारोह के अंदर फ़िल्टर करने की कोशिश कर रहा हूं। मूल रूप से जिस तरह से मैं क्लासिक मानचित्र-कम में करूँगा वह है कि फ़िल्टर मानदंडों को पूरा करते समय मैपर संदर्भ में कुछ भी लिख नहीं पाएगा। मैं स्पार्क के साथ समान कैसे प्राप्त कर सकता हूं? मैं मानचित्र फ़ंक्शन से शून्य वापस नहीं कर सकता क्योंकि यह शफल चरण में विफल रहता है। मैं या तो फ़िल्टर फ़ंक्शन का उपयोग कर सकता हूं लेकिन यह डेटा सेट के अनावश्यक पुनरावृत्ति प्रतीत होता है जबकि मैं मानचित्र के दौरान एक ही कार्य कर सकता हूं। मैं डमी कुंजी के साथ आउटपुट आउटपुट करने का भी प्रयास कर सकता हूं लेकिन यह एक खराब कामकाज है।स्पार्क - मानचित्र के भीतर फ़िल्टर
rdd.flatMap
:
क्या आप इस मुद्दे को चित्रित करने वाले नमूना कोड जोड़ सकते हैं? – maasg