2013-08-06 11 views
67

मैं एक्सएमएल जो कुछ गैर ASCII cheracter शामिल पार्स करने के लिए कोशिश कर रहा हूँ,सिंटैक्स त्रुटि

कोड की तरह

नीचे
from lxml import etree 
from lxml import objectify 
content = u'<?xml version="1.0" encoding="utf-8"?><div>Order date                            : 05/08/2013 12:24:28</div>' 
mail.replace('\xa0',' ') 
xml = etree.fromstring(mail) 

लेकिन यह मुझे लाइन 'सामग्री पर त्रुटि से पता चलता लग रहा है = ... '

तरह
syntaxError: Non-ASCII character '\xc2' in file /home/projects/ztest/responce.py on line 3, 
but no encoding declared; see http://www.python.org/peps/pep-0263.html for details 
टर्मिनल यह काम कर रहा में

लेकिन जब ग्रहण आईडीई पर चल रहा है यह मुझे एक त्रुटि दे रही है।

पता नहीं कैसे काबू पाने के लिए ..

+4

मैं इसे एक नकली नहीं लगता। लोग अक्सर इस पायथन एन्कोडिंग मुद्दे का सामना करते हैं। एसओ में समस्या विवरणों की इस समृद्ध शैली को हमारे ज्ञान आधार को बेहतर बनाता है। – DehengYe

उत्तर

159

आप स्रोत कोड एन्कोडिंग परिभाषित करना चाहिए अपनी स्क्रिप्ट के शीर्ष से जोड़ें:

# -*- coding: utf-8 -*- 

कारण है कि यह कंसोल में और में अलग काम करती है आईडीई, संभवतः, विभिन्न डिफ़ॉल्ट एन्कोडिंग सेट के कारण है। आप चलाकर यह जांच कर सकते हैं:

import sys 
print sys.getdefaultencoding() 

यह भी देखें:

संबंधित मुद्दे