मैं जापानी शब्द और पात्रों के बारे में जानकारी युक्त दो अजगर शब्दकोशों है:
यूनिकोड तार के माध्यम से दोहराएं और अजगर शब्दकोश में यूनिकोड के साथ तुलना
- vocabDic: शब्द, मूल्य:: शब्दावली, कुंजी है जानकारी के साथ शब्दकोश के बारे में यह
KANJIDIC: कांजी, मूल्य:: कांजी (एकल जापानी चरित्र), कुंजी है यह
अब के बारे में जानकारी के साथ शब्दकोश मैं throug पुनरावृति करना चाहते हैं h vocabDic में प्रत्येक शब्द के प्रत्येक चरित्र और इस चरित्र को कांजी शब्दकोश में देखें। मेरा लक्ष्य एक सीएसवी फ़ाइल बनाना है जिसे मैं शब्दावली और कांजी के लिए तालिका में शामिल होने के रूप में डेटाबेस में आयात कर सकता हूं।
kanjiVocabJoinWriter = csv.writer(open('kanjiVocabJoin.csv', 'wb'), delimiter=',', quotechar='|', quoting=csv.QUOTE_MINIMAL) kanjiVocabJoinCount = 1 #loop through dictionary for key, val in vocabDic.iteritems(): if val['lang'] is 'jpn': # only check japanese words vocab = val['text'] print vocab # loop through vocab string for v in vocab: test = kanjiDic.get(v) print v print test if test is not None: print str(kanjiVocabJoinCount)+','+str(test['id'])+','+str(val['id']) kanjiVocabJoinWriter([str(kanjiVocabJoinCount),str(test['id']),str(val['id'])]) kanjiVocabJoinCount = kanjiVocabJoinCount+1
अगर मैं कमांड लाइन करने के लिए चर मुद्रित, मैं:
vocab: काम करता है, जापानी
में प्रिंट
मेरे अजगर संस्करण 2.6
मेरे कोड निम्नलिखित के रूप में है v (लूप के लिए vocab का एक चरित्र):
परीक्षण (चरित्र कांजीजीक में देखा गया): कोई भी
मेरे लिए ऐसा लगता है जैसे लूप एन्कोडिंग को गड़बड़ कर देता है।
मैंने विभिन्न कार्यों (डीकोड, एनकोड ..) की कोशिश की लेकिन अब तक कोई भाग्य नहीं है।
इस पर कोई विचार है कि मैं यह कैसे काम कर सकता हूं?
सहायता बहुत सराहना की जाएगी।
क्या आप पाइथन 3 का उपयोग कर सकते हैं - इसका यूनिकोड बेहतर – Mark
या '__future__ आयात unicode_literals' से बेहतर है? – utdemir
आपको बहुत बहुत धन्यवाद! पायथन 3 को अपडेट करने से समस्या हल हो गई: डी – daniela