2015-11-08 10 views
8

दो मशीनों के साथ एक मशीन पर एक स्पार्क क्लस्टर सेटअप है, एक सार्वजनिक अन्य निजी। क्लस्टर में/etc/hosts फ़ाइल में क्लस्टर में अन्य सभी मशीनों का आंतरिक आईपी है, जैसे।यार्न क्लस्टर मोड में बाध्यकारी के लिए स्पार्क उपयोग/etc/hosts फ़ाइल बनाना

FQDN

internal_ip हालांकि जब मैं एक SparkContext pyspark के माध्यम से यार्न ग्राहक मोड (pyspark --master yarn --deploy-mode client), अक्का बांध में सार्वजनिक आईपी और इस प्रकार पर एक समय के लिए बाहर का अनुरोध होता है।

15/11/07 23:29:23 INFO Remoting: Starting remoting 
15/11/07 23:29:23 INFO Remoting: Remoting started; listening on addresses :[akka.tcp://[email protected]ublic_ip:44015] 
15/11/07 23:29:23 INFO util.Utils: Successfully started service 'sparkYarnAM' on port 44015. 
15/11/07 23:29:23 INFO yarn.ApplicationMaster: Waiting for Spark driver to be reachable. 
15/11/07 23:31:30 ERROR yarn.ApplicationMaster: Failed to connect to driver at yarn_driver_public_ip:48875, retrying ... 
15/11/07 23:31:30 ERROR yarn.ApplicationMaster: Uncaught exception: 
org.apache.spark.SparkException: Failed to connect to driver! 
    at org.apache.spark.deploy.yarn.ApplicationMaster.waitForSparkDriver(ApplicationMaster.scala:427) 
    at org.apache.spark.deploy.yarn.ApplicationMaster.runExecutorLauncher(ApplicationMaster.scala:293) 
    at org.apache.spark.deploy.yarn.ApplicationMaster.run(ApplicationMaster.scala:149) 
    at org.apache.spark.deploy.yarn.ApplicationMaster$$anonfun$main$1.apply$mcV$sp(ApplicationMaster.scala:574) 
    at org.apache.spark.deploy.SparkHadoopUtil$$anon$1.run(SparkHadoopUtil.scala:66) 
    at org.apache.spark.deploy.SparkHadoopUtil$$anon$1.run(SparkHadoopUtil.scala:65) 
    at java.security.AccessController.doPrivileged(Native Method) 
    at javax.security.auth.Subject.doAs(Subject.java:422) 
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657) 
    at org.apache.spark.deploy.SparkHadoopUtil.runAsSparkUser(SparkHadoopUtil.scala:65) 
    at org.apache.spark.deploy.yarn.ApplicationMaster$.main(ApplicationMaster.scala:572) 
    at org.apache.spark.deploy.yarn.ExecutorLauncher$.main(ApplicationMaster.scala:599) 
    at org.apache.spark.deploy.yarn.ExecutorLauncher.main(ApplicationMaster.scala) 
15/11/07 23:31:30 INFO yarn.ApplicationMaster: Final app status: FAILED, exitCode: 10, (reason: Uncaught exception: org.apache.spark.SparkException: Failed to connect to driver!) 
15/11/07 23:31:30 INFO yarn.ApplicationMaster: Unregistering ApplicationMaster with FAILED (diag message: Uncaught exception: org.apache.spark.SparkException: Failed to connect to driver!) 
15/11/07 23:31:30 INFO yarn.ApplicationMaster: Deleting staging directory .sparkStaging/application_1446960366742_0002 

लॉग से देखा के रूप में, निजी IP पूरी तरह से नजरअंदाज कर दिया है, मैं कैसे मेजबान के रूप में विनिर्दिष्ट फ़ाइल यार्न और चिंगारी निजी IP पते का उपयोग कर सकते हैं?

क्लस्टर प्रश्न के लिए Ambari (HDP 2,4)

उत्तर

0

यह वर्तमान में चिंगारी में एक मुद्दा है, चिंगारी उचित इंटरफ़ेस से आबद्ध होने पाने के लिए एक ही रास्ता कस्टम नेमसर्वर उपयोग करने के लिए है।

स्पार्क अनिवार्य रूप से होस्टनाम लुकअप करता है और आईपी पते का उपयोग करता है जो इसे अक्का से बांधता है। वर्कअराउंड कस्टम बाइंड ज़ोन बनाना और नेमसर्वर चलाने के लिए है।

https://issues.apache.org/jira/browse/SPARK-5113

1

+1 का उपयोग कर का प्रावधान किया गया था।

स्पार्क संचार के लिए अक्का का उपयोग करता है।

तो यह स्पार्क की तुलना में एक अक्का प्रश्न से अधिक है।

आप किसी दूसरे पते पर अपने नेटवर्क इंटरफेस बाध्य करने के लिए की जरूरत है - उपयोग akka.remote.netty.tcp.bind-होस्ट नाम और akka.remote.netty.tcp.bind बंदरगाह सेटिंग्स।

http://doc.akka.io/docs/akka/snapshot/additional/faq.html#Why_are_replies_not_received_from_a_remote_actor_

संबंधित मुद्दे