मैं मुसीबत सामग्री प्रदर्शित हो रही हैं मेरे कार्यक्रम में:बदलें & # 39 सामान्य चरित्र
#! /usr/bin/python
import urllib
import re
url = "http://yahoo.com"
pattern = '''<span class="medium item-label".*?>(.*)</span>'''
website = urllib.urlopen(url)
pageContent = website.read()
result = re.findall(pattern, pageContent)
for record in result:
print record
उत्पादन:
Masked teen killed by dad
First look in 'Hotel of Doom'
Ex-NFL QB's sad condition
Reporter ignores warning
Romney's low bar for debates
तो सवाल यह है कि मैं क्या में अपने कोड में शामिल होना चाहिए है आदेश & # 39 वर्ण
शायद http://stackoverflow.com/questions/57708/convert-xml-html-entities-into-unicode- साथ दोहराया स्ट्रिंग-इन-पायथन – charlee