से जोड़ा गया सामग्री मैं दूसरे यूआरएल से डेटा प्राप्त करना चाहता हूं जिसके लिए मैं urllib और सुंदर सूप का उपयोग कर रहा हूं, मेरा डेटा तालिका टैग के अंदर है (जिसे मैंने उपयोग किया है फ़ायरफ़ॉक्स कंसोल)। लेकिन जब मैंने अपनी आईडी का उपयोग करके टेबल लाने की कोशिश की तो परिणाम कोई नहीं है, तो मुझे लगता है कि इस तालिका को कुछ जेएस कोड के माध्यम से गतिशील रूप से जोड़ा जाना चाहिए।पायथन में स्क्रिप्ट टैग के अंदर चर के डेटा प्राप्त करें या जेएस
मैंने सभी दोनों पार्सर्स 'lxml', 'html5lib' की कोशिश की है लेकिन फिर भी मुझे वह तालिका डेटा नहीं मिल रहा है।
web = urllib.urlopen("my url")
html = web.read()
soup = BeautifulSoup(html, 'lxml')
js = soup.find("script")
ss = js.prettify()
print ss
परिणाम::
मैं भी एक और बात की कोशिश की है
<script type="text/javascript">
myPage = 'ETFs';
sectionId = 'liQuotes'; //section tab
breadCrumbId = 'qQuotes'; //page
is_dartSite = "quotes";
is_dartZone = "news";
propVar = "ETFs";
</script>
लेकिन अब मैं मैं इन js चर का डेटा कैसे प्राप्त कर सकते हैं पता नहीं है।
अब मेरे पास दो विकल्प हैं या तो उस तालिका सामग्री को प्राप्त करने के लिए जेएस चर, यह उनमें से कोई भी मेरा काम पूरा कर सकता है लेकिन दुर्भाग्य से मुझे नहीं पता कि इन्हें कैसे प्राप्त किया जाए, तो कृपया बताएं कि मैं किसी को कैसे हल कर सकता हूं समस्या में से एक
धन्यवाद
अनुमान लगा जावास्क्रिप्ट तालिका सामग्री पैदा कर रहा है कि क्या करने का कोई मतलब नहीं है - आपको लगता है कि पहले इस बात की पुष्टि करने की जरूरत है। क्या यूआरएल सार्वजनिक रूप से सुलभ है? यदि ऐसा है, तो ये क्या है? – mhawke
हां, मैं पुष्टि करता हूं कि जेएस कोड से टेबल डेटा जेनरेट किया गया है, आप यहां http://www.nasdaq.com/quotes/nasdaq-financial-100-stocks.aspx देख सकते हैं। – Inforian