import urllib
html = urllib.urlopen('http://random.yahoo.com/bin/ryl').read()
मुझे लगता है कि एक यादृच्छिक पृष्ठ खींच लागू करने के लिए और ज्यादा कुछ भी आप अपने आप को कार्यक्रम सकता है की तुलना में यादृच्छिक हो जाएगा आसान है। यादृच्छिक पृष्ठों को बनाने के लिए डिज़ाइन किए गए किसी भी कार्यक्रम को अभी भी HTML की संरचना को परिभाषित करने वाले नियमों का पालन करना होगा। चूंकि इंसान मशीनों की तुलना में बहुत बेहतर और तोड़ने वाले नियम हैं, इसलिए वेब से एक यादृच्छिक पृष्ठ में संरचनाओं को शामिल करने की अधिक संभावना होती है जो आपको यादृच्छिकता से नहीं मिलती हैं।
आपको याहू का उपयोग करने की ज़रूरत नहीं है, शायद अन्य यादृच्छिक लिंक जेनरेटर हैं, या आप अपना खुद का निर्माण कर सकते हैं।
... मैं मुझे पसंद है जहां इस परियोजना के लिए जा रहा है लगता है;) मामले में आप एमआईटी कागज जनरेटर की कभी नहीं सुना है: http://web.mit.edu/newsoffice/2005/paper.html – Stephen
http://www.w3.org/TR/REC-html40/sgml/intro.html एचटीएमएल के लिए व्याकरण (एक एसजीएमएल डीटीडी के रूप में) देता है, लेकिन मुझे नहीं पता कि आपको एसजीएमएल गिबर जेनरेटर लाइब्रेरी कहां मिलेगी ... – derobert
पायथन के लिए एक डीटीडी पार्सर है: http://www.garshol.priv.no/download/software/xmlproc/dtd-parser-doco.html। – svick