utf16 या utf32? मैं कई भाषाओं में सामग्री स्टोर करने की कोशिश कर रहा हूं। कुछ भाषाएं डबल-चौड़े फोंट का उपयोग करती हैं (उदाहरण के लिए, जापानी फोंट अक्सर अंग्रेजी फोंट के रूप में चौड़े होते हैं)। मुझे यकीन नहीं है कि मुझे किस प्रकार का डेटाबेस उपयोग करना चाहिए। इन चार वर्णों के बीच मतभेदों के बारे में कोई जानकारी ...Utf8_general_ci या utf8mb4 या ...?
28
A
उत्तर
40
MySQL का utf32
और utf8mb4
(साथ ही मानक यूटीएफ -8) यूनिकोड द्वारा निर्दिष्ट किसी भी चरित्र को सीधे स्टोर कर सकता है; पूर्व प्रति आकार 4 बाइट्स पर तय आकार है जबकि उत्तरार्द्ध प्रति चरित्र 1 और 4 बाइट्स के बीच है।
utf8mb3
और मूल utf8
केवल पहले 65,536 कोडपॉइंट स्टोर कर सकता है, जिसमें सीजेवीके (चीनी, जापानी, वियतनाम, कोरियाई) शामिल होगा, और प्रति चरित्र 1 से 3 बाइट्स का उपयोग करेगा।
utf16
पहले 65,536 कोडपॉइंट्स के लिए 2 बाइट्स और अन्य सभी चीज़ों के लिए 4 बाइट्स का उपयोग करता है।
फोंट के लिए, यह सख्ती से एक दृश्य चीज है।
भी MySQL documentation for Unicode support देखें।
संबंधित मुद्दे
- 1. MySQL मिलान: utf8_general_ci बनाम latin1_swedish_ci
- 2. utf8_general_ci टेबल और फ़ील्ड को utf8_unicode_ci
- 3. टैग या खोज या
- 4. इंडी या आईसीएस या?
- 5. '(' या '['
- 6. एमवीसी या आराम या दोनों
- 7. अजवाइन या beanstalkd या दोनों?
- 8. यूआरएल या सत्र या अन्य
- 9. या तो या आवश्यक प्रमाणीकरण
- 10. addMouseListener या addActionListener या JButton?
- 11. या तो पाइथन या php
- 12. या तो डिवाइस या होस्ट
- 13. बीएएसएच या अजीब या sed या किसी भी
- 14. नोड.जेएस: क्या मैं वाउज़ या एक्सप्रेसो या नोड यूनिट या ज़ोंबी.जेएस या सभी का उपयोग करूंगा?
- 15. जावा: एक कन्स्ट्रक्टर या विधि जो सरणी या सेट या सूची स्वीकार करेगी या ...?
- 16. डाटाबेस - (पंक्तियों या अभिलेख, कॉलम या फ़ील्ड)?
- 17. "मार्शल" या "मार्शल"? "मार्शलिंग" या "मार्शलिंग"?
- 18. सेटटाइमआउट या सेट इंटरवल या अनुरोधएनीमेशन फ्रेम
- 19. स्थानीय कॉल या एसटीडी या आईएसडी
- 20. क्रोम या फ़ायरफ़ॉक्स (या ब्राउज़र-अज्ञेयवादी)?
- 21. कॉपी या कॉपी ओवरराइड WithZone: या दोनों?
- 22. रेडिस "शून्य" या "खाली सूची या सेट"
- 23. यूडीपी सुरक्षित - ओपनएसएसएल या जीएनयूटीएल या ...?
- 24. पीयर समीक्षा या जोड़ी प्रोग्रामिंग, या दोनों?
- 25. सूची (स्ट्रिंग का) या ऐरे या ऐरेलिस्ट
- 26. क्लोन या कॉपी UIViewController या UIView
- 27. एएसपी.नेट - पेज_Pre_init() या पेज_इनिट() या पेज_लोड()
- 28. PHP: एक बी या सी या डी
- 29. नोडजेएस-एक्सप्रेस या उल्का या डर्बी
- 30. एरलांग HTTP क्लाइंट: इनसेट या इब्रोसे या ...?
बस अतिरिक्त स्पष्ट होने के लिए, 'utf8_general' के बारे में टिप्पणी अन्य सभी 'utf8_ *' collations पर भी लागू होती है; सभी MySQL के 'utf8mb3' उर्फ' utf8' charset का उपयोग करेंगे। –
@ जॉन फ्लाइटनेस धन्यवाद। आपकी टिप्पणी सिर्फ वही है जो मैं अगले के बारे में पूछने जा रहा था। मैंने सोचा कि यूटीएफ -16 ने मंदारिन पात्रों के लिए 2 बाइट्स का इस्तेमाल किया, उदाहरण के लिए, हालांकि? मैं आपके द्वारा दिए गए दस्तावेज को देख रहा हूं, उम्मीद कर रहा हूं कि इसमें 65,536 का अर्थ है। एक्सडी –
चीनी वर्ण मूल बहुभाषी विमान (पहले 65,536 कोडपॉइंट्स) के भीतर हैं। –