मैं एक एमएल Pipeline
बनाने की कोशिश निम्न त्रुटि हो रही है:PySpark DataFrame में ArrayType से DenseVector को कैसे परिवर्तित करें?
pyspark.sql.utils.IllegalArgumentException: 'requirement failed: Column features must be of type [email protected] but was actually ArrayType(DoubleType,true).'
मेरे features
स्तंभ चल बिन्दु मूल्यों की एक सरणी में शामिल है। ऐसा लगता है कि मुझे उन्हें किसी प्रकार के वेक्टर में बदलने की ज़रूरत है (यह स्पैस नहीं है, इसलिए एक डेंस वेक्टर?)। क्या डेटाफ्रेम पर सीधे ऐसा करने का कोई तरीका है या क्या मुझे आरडीडी में कनवर्ट करने की ज़रूरत है?