में स्पार्क डेटाफ्रेम से लेबल किए गए अंक बनाएं, क्या मैं पाइथन में क्या .map() फ़ंक्शन का उपयोग करता हूं, क्या मैं स्पार्क डेटाफ्रेम से लेबल किए गए पॉइंट्स का एक सेट बनाने के लिए उपयोग करता हूं? यदि लेबल/परिणाम पहला कॉलम नहीं है तो नोटेशन क्या है लेकिन मैं इसके कॉलम नाम, 'स्थिति' का संदर्भ ले सकता हूं?पाइथन
मैं इस .map() फ़ंक्शन के साथ अजगर dataframe बनाएँ:
def parsePoint(line):
listmp = list(line.split('\t'))
dataframe = pd.DataFrame(pd.get_dummies(listmp[1:]).sum()).transpose()
dataframe.insert(0, 'status', dataframe['accepted'])
if 'NULL' in dataframe.columns:
dataframe = dataframe.drop('NULL', axis=1)
if '' in dataframe.columns:
dataframe = dataframe.drop('', axis=1)
if 'rejected' in dataframe.columns:
dataframe = dataframe.drop('rejected', axis=1)
if 'accepted' in dataframe.columns:
dataframe = dataframe.drop('accepted', axis=1)
return dataframe
मैं कम समारोह के बाद एक चिंगारी dataframe करने के लिए इसे परिवर्तित सभी पांडा dataframes पुनर्संयोजन गया है।
parsedData=sqlContext.createDataFrame(parsedData)
लेकिन अब मैं पाइथन में इस से labledPoints कैसे बना सकता हूं? मुझे लगता है कि यह एक और .map() फ़ंक्शन हो सकता है?
यह काम नहीं करता, दुर्भाग्य से। सबसे पहले, '.map() 'डेटाफ्रेम के साथ काम नहीं करता है। दूसरा, यहां तक कि अगर कोई पहले आरडीडी में परिवर्तित हो जाता है, तो यह त्रुटि टाइप करता है 'TypeError: प्रकार वेक्टर में परिवर्तित नहीं कर सकता। –
xenocyon