मैं एक स्पार्क DataFrame रूपPyspark DataFrame में चुना पंक्ति से विशिष्ट क्षेत्र हो रही
sc = SparkContext()
sqlc = SQLContext(sc)
users_df = sqlc.read.json('users.json')
pyspark के माध्यम से बनाया गया एक JSON फ़ाइल से अब है, मैं, एक chosen_user डेटा का उपयोग करना चाहते हैं, जहां यह है इसके _id फ़ील्ड मैं
print users_df[users_df._id == chosen_user].show()
और यह मुझे उपयोगकर्ता की पूरी पंक्ति देता है। लेकिन मान लीजिए कि मैं पंक्ति में एक विशिष्ट फ़ील्ड चाहता हूं, उपयोगकर्ता लिंग कहूं, मैं इसे कैसे प्राप्त करूं?
क्या एकाधिक 'चुने गए_यूसर' मानों के आधार पर पंक्तियों को निकालना संभव है और केवल एक ही नहीं? – Nivi