मैं Zemanta एपीआई का उपयोग कर रहा है, जो प्रति कॉल पाठ के 8 KB को स्वीकार करने के लिए पाठ काटना जावास्क्रिप्ट का उपयोग करना। मैं जावास्क्रिप्ट का उपयोग कर वेब पेजों से ज़ेमेन्टा को भेजने के लिए टेक्स्ट निकालने जा रहा हूं, इसलिए मैं एक ऐसे फ़ंक्शन की तलाश में हूं जो मेरे टेक्स्ट को ठीक से 8 केबी पर छोटा कर देगा।एक निश्चित आकार (8 KB)
ज़ेमेन्टा को अपने आप को इस छंटनी को करना चाहिए (यानी, यदि आप इसे एक बड़ी स्ट्रिंग भेजते हैं), लेकिन मुझे एपीआई कॉल करने से पहले इस पाठ को थोड़ा सा शटल करना होगा, इसलिए मैं पेलोड को छोटे के रूप में रखना चाहता हूं मुमकिन।
यह मान लेना कि पाठ के 8 KB 8,192 वर्ण है, और उसके अनुसार काट-छांट करने के लिए सुरक्षित है? (1 बाइट प्रति चरित्र; 1,024 वर्ण प्रति केबी; 8 केबी = 8,192 बाइट/वर्ण) या, क्या यह गलत या केवल कुछ निश्चित परिस्थितियों को सच है?
वहाँ अपने वास्तविक फ़ाइल आकार के आधार पर एक स्ट्रिंग को काटना एक और अधिक सुरुचिपूर्ण रास्ता नहीं है?
आप जांच करना चाह सकते लेख है जिसे आप साथ काम कर रहे कुछ एन्कोडिंग, उदा की कर रहे हैं यूटीएफ -8, एएससीआईआई आदि? यदि आप निश्चित हैं कि पाठ में केवल एक-बाइट वर्ण हैं, तो कटाव अधिक सरल होगा। आप कुछ लचीलापन का व्यापार करेंगे। इस बात के लिए कि ज़ेमेन्टा 8 केबी 8192 बाइट्स या 8000 बाइट्स के रूप में व्यवहार करता है, तो आप इसका परीक्षण क्यों नहीं करते? –
धन्यवाद, ओ.के.मुझे लगता है कि डोमिनिक सही है कि यह पाठ (संभवतः यूटीएफ -8) संभावित रूप से प्रति चरित्र एकाधिक बाइट्स ले जाएगा, इसलिए चरित्र-मात्रा के आधार पर मापना संभव नहीं होगा। – Bungle