के साथ विशाल जेसन-सरणी फ़ाइलों को प्रोसेस करना मेरे पास अपेक्षाकृत छोटी वस्तुओं की विशाल (~ 7 जीबी) जेसन सरणी है।jq
क्या पूरे ऑब्जेक्ट को स्मृति में लोड किए बिना इन वस्तुओं को फ़िल्टर करने का अपेक्षाकृत सरल तरीका है?
- स्ट्रीम विकल्प उपयुक्त दिखता है, लेकिन मैं यह नहीं समझ सकता कि मूल वस्तुओं में [पथ, मूल्य] की धारा को कैसे फोल्ड करना है।
छोटे दुनिया यहाँ पत्रक की एक धारा का उत्पादन करने का तरीका बताया। मैं अभी भी इसी तरह की समस्या के खिलाफ आया हूं। ब्याज से, क्या आपकी जेसन फ़ाइल में व्हाइटस्पेस अनुमानित है? उदाहरण के लिए, बड़े जेसन सरणी अक्सर प्रति पंक्ति स्तर सरणी आइटम एक पंक्ति का उपयोग करते हैं? – Tom
यदि फ़ाइल पहले से ही नियमित रूप से स्वरूपित है, तो हो सकता है कि आप फ़ाइल को छोटी वस्तुओं की धारा में परिवर्तित करने के लिए टेक्स्ट-wrangling टूल का उपयोग करने पर विचार करना चाहें, जिसे बाद में jq का उपयोग करके संसाधित किया जा सकता है। अगर फ़ाइल पहले से ही उपयुक्त रूप से स्वरूपित नहीं है, तो अगर पूरी फ़ाइल पर सिर्फ एक बार jq का उपयोग करने के लिए स्वीकार्य है, तो आप JSON को प्रारूपित करने के लिए 'jq।' का उपयोग करने पर विचार कर सकते हैं ताकि इस तरह की स्ट्रीम में कनवर्ट करना आसान हो। – peak