स्पार्क कम करने वाले कार्यों की संख्या की गणना करने के लिए किस सूत्र का उपयोग करता है?संख्याओं को कम करें स्पार्क
मैं कुछ स्पार्क-एसक्यूएल प्रश्नों को चला रहा हूं और कम कार्यों की संख्या हमेशा 200 है। इन प्रश्नों के लिए मानचित्र कार्यों की संख्या 154 है। मैं स्पार्क 1.4.1 पर हूं।
spark.shuffle.sort.bypassMergeThreshold को यह संबंधित, 200