हां मैं पहले से ही यूनी विविध समय श्रृंखला के लिए स्पार्क में एआरआईएमए लागू कर चुका हूं।
public static void main(String args[])
{
System.setProperty("hadoop.home.dir", "C:/winutils");
SparkSession spark = SparkSession
.builder().master("local")
.appName("Spark-TS Example")
.config("spark.sql.warehouse.dir", "file:///C:/Users/abc/Downloads/Spark/sparkdemo/spark-warehouse/")
.getOrCreate();
Dataset<String> lines = spark.read().textFile("C:/Users/abc/Downloads/thunderbird/Time series/trainingvector_arima.csv");
Dataset<Double> doubleDataset = lines.map(line>Double.parseDouble(line.toString()),
Encoders.DOUBLE());
List<Double> doubleList = doubleDataset.collectAsList();
//scala.collection.immutable.List<Object> scalaList = new
Double[] doubleArray = new Double[doubleList.size()];
doubleArray = doubleList.toArray(doubleArray);
double[] values = new double[doubleArray.length];
for(int i = 0; i< doubleArray.length; i++)
{
values[i] = doubleArray[i];
}
Vector tsvector = Vectors.dense(values);
System.out.println("Ts vector:" + tsvector.toString());
//ARIMAModel arimamodel = ARIMA.fitModel(1, 0, 1, tsvector, true, "css-bobyqa", null);
ARIMAModel arimamodel = ARIMA.autoFit(tsvector, 1, 1, 1);
Vector forcst = arimamodel.forecast(tsvector, 10);
System.out.println("forecast of next 10 observations: " + forcst);
}
इस कोड मेरे लिए काम करता है। यहां कोई भी मान जो आप पूर्वानुमान डेटा के रूप में पास करना चाहते हैं।
स्रोत
2016-12-22 10:24:41
आप * पर विस्तृत सकता है "चिंगारी रैखिक प्रतिगमन है और मैं इसे करने की कोशिश की, लेकिन मैं संतोषजनक परिणाम प्राप्त नहीं किया" * - लिंक स्पार्क के लिए एल्गोरिथ्म + क्या आप पहले से ही की कोशिश की है और जहां वे डॉन एक नोट के साथ परिणाम ' आपकी उम्मीद को पूरा नहीं करते हैं। –
कृपया इस सार को देखो। वहाँ टिप्पणी करने के लिए स्वतंत्र महसूस, मैं डेटा और एल्गोरिथ्म जोड़ लिया है https://gist.github.com/codeAshu/2ebd84b1b48834fce89b – Rusty
मैं भी इस सवाल को देखा लेकिन _ "partitionBy" _ मुझे त्रुटि दे रहा है [http://stackoverflow.com/प्रश्न/23402303/अपाचे-चिंगारी से आगे बढ़-औसत] – Rusty