का उपयोग कर फेसबुक जैसी लिंक सारांश (शीर्षक, सारांश, प्रासंगिक छवियां) पुनर्प्राप्त करना मैं उस कार्यक्षमता को दोहराना चाहता हूं जो फेसबुक एक लिंक को पार्स करने के लिए उपयोग करता है। जब आप अपनी फेसबुक स्थिति में एक लिंक जमा करते हैं, तो उनका सिस्टम बाहर निकलता है और सुझाए गए title
, summary
और अक्सर उस पृष्ठ से एक या अधिक प्रासंगिक image
s पुनर्प्राप्त करता है, जिससे आप थंबनेल चुन सकते हैं।पायथन
मेरे आवेदन को पायथन का उपयोग करके इसे पूरा करने की आवश्यकता है, लेकिन मैं किसी भी प्रकार की मार्गदर्शिका, ब्लॉग पोस्ट या अन्य डेवलपर्स के अनुभव के लिए खुला हूं जो इससे संबंधित है और मुझे यह समझने में मदद कर सकता है कि इसे कैसे पूरा किया जाए। ।
मैं वास्तव में स्पष्ट रूप से कहें तो बस में कूदने से पहले अन्य लोगों के अनुभव से सीखते हैं चाहते हैं
, जब एक वेब पेज का URL को देखते हुए, मैं पुनः प्राप्त करने में सक्षम होना चाहते:
- शीर्षक: शायद केवल
<title>
टैग लेकिन संभवतः<h1>
, सुनिश्चित नहीं है। - पृष्ठ का एक अनुच्छेद सारांश।
- प्रासंगिक छवियों का एक समूह जिसे थंबनेल के रूप में उपयोग किया जा सकता है। (मुश्किल हिस्सा बैनर या गोलाकार कोनों जैसे अप्रासंगिक छवियों को फ़िल्टर करना है)
मुझे इसे स्वयं लागू करना पड़ सकता है, लेकिन मैं कम से कम जानना चाहता हूं कि अन्य लोग इस तरह के कार्यों को कैसे कर रहे हैं।
BeautifulSoup अच्छी तरह से अजगर 3.1 पर समर्थित नहीं है, और इसके मूल लेखक अब और ज्यादा विकास नहीं करता है। आप शायद lxml.html और/या html5lib का उपयोग बेहतर करते हैं (बाद वाले को सुंदर सूप लेखक द्वारा अनुशंसित किया जाता है)। – lunaryorn
भविष्य के संदर्भ के लिए जानना अच्छा है। धन्यवाद! –