अजगर 2.5 का उपयोग करना, मैं एक यूनिकोड वस्तु में संग्रहीत में कुछ पाठ है:मैं पायथन का उपयोग कर यूनिकोड अपघटन को कैसे उलट सकता हूं?
Dinis ई इसाबेल, उमा relac¸a~o difı'cil वैवाहिक ई polı'tica
यह प्रतीत होता है decomposed Unicode होने के लिए। वहाँ पायथन में एक सामान्य तरीके अपघटन उल्टा करने के लिए है, इसलिए मैं के साथ अंत:
Dinis ई इसाबेल, उमा difícil relação वैवाहिक ई política
हां, यह काम करता है - मान लीजिए कि मैंने वास्तव में यूनिकोड को विघटित किया है। दुर्भाग्यवश ऐसा लगता है कि मेरे पाठ में \ u0327 (cedilla संयोजन) के बजाय वास्तव में \ u00B8 (cedilla) है (उदाहरण के लिए)। ऐसा लगता है कि मुझे इन वर्णों को उनके संयोजन के बराबर मैप करने की आवश्यकता होगी या बस उन्हें पूरी तरह से पट्टी करनी होगी। धन्यवाद। – msanders