मैं वेब से एक टेबल स्क्रैप करना चाहता हूं और & nbsp; संस्थाएं बरकरार हैं ताकि मैं बाद में HTML के रूप में पुन: प्रकाशित कर सकूं। प्रतीत होता है कि सुंदर सूप इन जगहों पर स्थानांतरित कर रहा है। उदाहरण:खूबसूरत सूप का उपयोग करके स्क्रैप इकाइयों
from bs4 import BeautifulSoup
html = "<html><body><table><tr>"
html += "<td> hello </td>"
html += "</tr></table></body></html>"
soup = BeautifulSoup(html)
table = soup.find_all('table')[0]
row = table.find_all('tr')[0]
cell = row.find_all('td')[0]
print cell
मनाया परिणाम:
<td> hello </td>
आवश्यक परिणाम:
<td> hello </td>
जवाब के लिए धन्यवाद :) –