मैं एक पाइथन फ़ाइल स्पार्क-सबमिट कर रहा हूं जो numpy आयात करता है लेकिन मुझे no module named numpy
त्रुटि मिल रही है।स्पार्क सबमिट करने पर कोई मॉड्यूल नहीं है
$ spark-submit --py-files projects/other_requirements.egg projects/jobs/my_numpy_als.py
Traceback (most recent call last):
File "/usr/local/www/my_numpy_als.py", line 13, in <module>
from pyspark.mllib.recommendation import ALS
File "/usr/lib/spark/python/pyspark/mllib/__init__.py", line 24, in <module>
import numpy
ImportError: No module named numpy
मैं सोच रहा था मैं numpy -python-फ़ाइलों के लिए एक अंडे में खींच सकता है, लेकिन मैं मुसीबत पता लगाना है कि अंडे का निर्माण करने के लिए कैसे हो रही है। लेकिन फिर यह मेरे लिए हुआ कि pyspark खुद numpy का उपयोग करता है। यह मूर्खतापूर्ण के अपने संस्करण में खींचने के लिए मूर्खतापूर्ण होगा।
यहां उचित चीज़ पर कोई विचार है?
वर्तमान में उपयोग कर रहे पाइथन बाइनरी के लिए पूर्ण SciPy या स्वतंत्र NumPy पैकेज स्थापित करने का प्रयास करें: http://www.scipy.org/install.html –