2014-10-24 20 views
5

मैं एक चिंगारी 24X7 स्ट्रीमिंग और NetworkWordCount उदाहरण के मामले में की तरह गणना की ऐतिहासिक डेटा को बचाने के लिए समारोह updateStateByKey का उपयोग कर चला रहा हूँ ..स्पार्क स्ट्रीमिंग UpdateStateByKey

मैं 1 सेकंड नींद के साथ 3lac रिकॉर्ड के साथ एक फ़ाइल स्ट्रीम करने के लिए करने की कोशिश की कर रहा हूँ हर 1500 रिकॉर्ड के लिए। में काम आईडी अपवाद 1635 java.lang.ArrayIndexOutOfBoundsException: मैं 3 श्रमिकों

  1. अवधि updateStateByKey बढ़ रहा है से अधिक का उपयोग कर रहा है, तो कार्यक्रम निम्न अपवाद फेंकता

त्रुटि निर्वाहक 3

14/10/23 21:20:43 ERROR TaskSetManager: Task 29170.0:2 failed 1 times; aborting job 
14/10/23 21:20:43 ERROR DiskBlockManager: Exception while deleting local spark dir: /var/folders/3j/9hjkw0890sx_qg9yvzlvg64cf5626b/T/spark-local-20141023204346-b232 
java.io.IOException: Failed to delete: /var/folders/3j/9hjkw0890sx_qg9yvzlvg64cf5626b/T/spark-local-20141023204346-b232/24 

14/10/23 21:20:43 ERROR Executor: Exception in task ID 8037 
java.io.FileNotFoundException: /var/folders/3j/9hjkw0890sx_qg9yvzlvg64cf5626b/T/spark-local-20141023204346-b232/22/shuffle_81_0_1 (No such file or directory) 
    at java.io.FileOutputStream.open(Native Method) 

इसे कैसे संभालें? मुझे लगता है कि अद्यतनस्टेटबीकी को समय-समय पर तेजी से बढ़ने के रूप में रीसेट किया जाना चाहिए, कृपया अपडेटस्टेटबीकी को कब और कैसे रीसेट करना है, इस बारे में कुछ उदाहरण साझा करें .. या मुझे कोई और समस्या है? कुछ रोशनी डालो।

किसी भी मदद की बहुत सराहना की जाती है। आपके समय के लिए धन्यवाद

उत्तर

0

क्या आपने चेकपॉइंट ssc.checkpoint ("चेकपॉइंट के लिए पथ")

सेट किया था
संबंधित मुद्दे