2017-04-01 17 views
7

मेरे पास YARN पर एक स्पार्क नौकरी चल रही है और ऐसा लगता है कि यह किसी भी गणना नहीं कर रहा है और ऐसा नहीं कर रहा है। जब मैं yarn application -list जाँच,मैं कैसे बता सकता हूं कि मेरी स्पार्क नौकरी प्रगति कर रही है या नहीं?

Application Report : 
Application-Id : applicationID 
Application-Name : test app 
Application-Type : SPARK 
User : ec2-user 
Queue : default 
Start-Time : 1491005660004 
Finish-Time : 0 
Progress : 10% 
State : RUNNING 
Final-State : UNDEFINED 
Tracking-URL : http://<ip>:4040 
RPC Port : 0 
AM Host : <host ip> 
Aggregate Resource Allocation : 36343926 MB-seconds, 9818 vcore-seconds 
Log Aggregation Status : NOT_START 
Diagnostics : 

और यह कहना है कि यह RUNNING है:

यहाँ जब मैं yarn application -status <APPLICATIOM ID> करना क्या यार्न का कहना है। लेकिन मुझे यकीन नहीं है कि मैं उस पर भरोसा करता हूं। जब मैं चिंगारी WebUI लिए जाते हैं, मैं केवल एक चरण पूरा कुछ ही घंटों देख मैं इसे बराबर चल रही है:

web UI

इसके अलावा, जब मैं "चरणों" टैब पर क्लिक करें, मैं कुछ भी नहीं चल रहा है देखते हैं:

Stages tab

कैसे सुनिश्चित करते हैं कि अपने आवेदन वास्तव में चल रहा है और उस YARN मेरे लिए झूठ नहीं बोल रही है?

मैं वास्तव में यह देखने के लिए एक त्रुटि फेंकना चाहूंगा कि यह देखने के लिए कि यह काम सक्रिय रूप से चल रहा है या नहीं। मैं उसको कैसे करू?

उत्तर

3

चिंगारी आवेदन यूआई

आप लिंक पर क्लिक करते पर: "छत Nativexxxx पर" यह आप चल रहा है चरण के लिए विवरण दिखाई देंगे।

उस स्क्रीन पर "इनपुट आकार/रिकॉर्ड्स" कॉलम होगा। यदि आपका काम प्रगति कर रहा है तो उस कॉलम में दिखाए गए नंबर में बदलाव आएगा।

Image shows what I am trying to say

यह मूल रूप से अपने निष्पादक द्वारा पढ़ा अभिलेखों की संख्या को दर्शाया गया है।

+0

एचएम। मुझे वह नहीं दिख रहा है। क्या इसका मतलब है कि यह प्रगति नहीं कर रहा है? – Candic3

+0

क्या हम इसे थोड़ा सा चैट करने के लिए ले सकते हैं? – Candic3

+1

http://chat.stackoverflow.com/rooms/139996/spark-job- प्रगति – Candic3

1

यदि आप स्पार्क यूआई पर जाते हैं और "निष्पादक" टैब की खोज करते हैं। वहां आपके पास सूची निष्पादक होंगे कि आपका काम निष्पादक आईडी और पते पर और उसके आगे चल रहा है, आपके पास "लॉग" कॉलम होगा, आपके पास "stdout" & "stderr" टैब होगा। स्टडआउट पर क्लिक करें और वहां आप लॉग इन देख सकते हैं जो आपके कंटेनर पर लिखे गए थे जब आपका काम चल रहा है।

+0

लेकिन सिर्फ इसलिए कि लॉग लिखे जा रहे हैं - क्या इसका मतलब यह है कि नौकरी प्रगति कर रही है? लॉग कुछ लिख रहे थे जैसे 'पर्याप्त संसाधनों की प्रतीक्षा' या कुछ, सही? – Candic3

+0

@ Candic3 हां आप सही हैं। लेकिन यह आपके लॉग को ट्रैक करने का सबसे अच्छा तरीका है और आप यार्न और उसके संसाधनों से संबंधित सभी जानकारी भी देख सकते हैं। – BadBoy777

+0

@ Candic3 ऐसा लगता है कि आपके पास यार्न क्लस्टर में पर्याप्त संसाधन नहीं है। – Kaushal

1

YARN कह रहा है कि यह चल रहा है क्योंकि आवेदन बाहर नहीं हुआ है या मार डाला गया है। यह नहीं पता कि यह अटक गया है या नहीं। आपके मामले में आप यार्न-क्लाइंट मोड में Spark नौकरी चला सकते हैं और लॉग देख सकते हैं जो सुझाव दे सकते हैं कि यह वास्तव में चल रहा है या नहीं।

संबंधित मुद्दे

 संबंधित मुद्दे