मैं पाइथन और बीटफुल सूप के लिए भी नया हूं! मैंने बीएस के बारे में सुना। इसे सामग्री को पार्स और निकालने के लिए एक बेहतरीन टूल कहा जाता है। तो यहां मैं हूं ...:सुंदर सूप [पायथन] और तालिका में पाठ का निकालने
मैं एक HTML दस्तावेज़ में किसी तालिका के पहले टीडी की सामग्री लेना चाहता हूं। उदाहरण के लिए, मैं इस तालिका
<table class="bp_ergebnis_tab_info">
<tr>
<td>
This is a sample text
</td>
<td>
This is the second sample text
</td>
</tr>
</table>
मैं BeautifulSoup कैसे उपयोग कर सकते हैं पाठ लेने के लिए "यह एक नमूना पाठ है" है? मैं पूरे तालिका में प्राप्त करने के लिए soup.findAll ('table', attrs = {'class': 'bp_ergebnis_tab_info'}) का उपयोग करता हूं।
धन्यवाद ... या मुझे पर्ल के साथ पूरी चीजें प्राप्त करने का प्रयास करना चाहिए ... जो मैं इतना परिचित नहीं हूं। एक और हल PHP में एक regex होगा।
लक्ष्य [1] देखें: http://www.schulministerium.nrw.de/BP/SchuleSuchen?action=799.601437941842&SchulAdresseMapDO=142323
नोट; चूंकि एचटीएमएल थोड़ा अमान्य है - मुझे लगता है कि हमें कुछ सफाई करना है। इससे बहुत सारे PHP कोड हो सकते हैं - क्योंकि हम PHP में नौकरी को हल करना चाहते हैं। पर्ल भी एक अच्छा समाधान होगा।
कुछ संकेत और एक प्रारंभिक बिंदु के लिए विचारों के लिए बहुत-बहुत धन्यवाद शून्य
ठीक है, स्पष्ट रूप से, आप अपने पर्ल प्रश्नों से अधिक लाभ उठाने में असफल रहे हैं, इसलिए मुझे यह भी यकीन नहीं है कि यह सवाल पर्ल के साथ क्यों टैग किया गया है। साथ ही, हर कुछ हफ्तों में नए खाते न बनाएं: एक बनाएं और इसके साथ चिपके रहें। @zero जानता है कि मैं किस बारे में बात कर रहा हूं। अन्य http: // stackoverflow पर एक नज़र डाल सकते हैं।कॉम/उपयोगकर्ता/477580/thebutcher और http://stackoverflow.com/q/3991571/100754 और वहां से जुड़े प्रश्न। –