थोड़ा सा शोध करने के बाद लोगों ने खिताब को कैसे कम किया है, मैंने देखा है कि अक्सर गैर-अंग्रेज़ी खिताब से निपटने के तरीके को याद किया जाता है।स्लग्स और यूनिकोड के लिए नियम
यूआरएल एन्कोडिंग बहुत ही सीमित है। http://www.blooberry.com/indexdot/html/topics/urlencoding.htm
देखें तो, उदाहरण के लिए कैसे लोगों
जैसी चीजों के लिए शीर्षक मल के लिए से निपटने के है "Una Lagrima कायो एन ला अखाड़ा"
एक भारत यूरोपीय भाषाओं के लिए एक उचित तालिका के साथ आ सकते हैं, अर्थात। चीजें जिन्हें आईएसओ -885 9 -1 के माध्यम से एन्कोड किया जा सकता है। उदाहरण के लिए, एक रूपांतरण सारणी 'ए' => 'एक' है, तो स्लग होगा
यूनिकोड"ऊना-lagrima-कायो-en-la-क्षेत्र"
हालांकि, मैं उपयोग कर रहा हूँ अनुवाद होगा (विशेष रूप से यूटीएफ -8 एन्कोडिंग का उपयोग करके), इसलिए मुझे किस तरह के कोड पॉइंट प्राप्त करने जा रहे हैं, इस बारे में कोई गारंटी नहीं है (मुझे उन चीज़ों के लिए तैयार करना है जो आईएसओ -885 9 -1 एन्कोडेड नहीं हो सकते हैं।
मैं एक नुस्खे इस से निपटने के लिए कैसे? क्या मुझे ISO_8859-1 रेंज (< 255) में वर्णों के लिए रूपांतरण तालिका के साथ आना चाहिए और बाकी सब कुछ छोड़ना चाहिए?
संपादित करें: थोड़ा और संदर्भ देने के लिए, एक प्राथमिकता, मैं वास्तव में गैर-यूरोपीय यूरोपीय भाषाओं में डेटा को कम करने की उम्मीद नहीं करता हूं, लेकिन अगर मुझे ऐसा डेटा मिलता है तो मैं एक योजना बनाना चाहता हूं। विस्तारित ASCII के लिए एक रूपांतरण तालिका अच्छा होगा। कोई संकेतक?
इसके अतिरिक्त, क्योंकि लोग कह रहे हैं, मैं अजगर उपयोग कर रहा हूँ,
वैसे, क्या यूआरएल में यूनिकोड की अनुमति क्यों नहीं है इसके लिए कोई अच्छा कारण है? – Zifre