मुझे आश्चर्य है कि क्या कोई मौजूदा पुस्तकालय उद्देश्य-सी से उपलब्ध है या पहुंच योग्य है जो मुझे this one जैसे प्रारूपित पृष्ठों को स्क्रैप करने की अनुमति देगा। विशेष रूप से, प्रत्येक तारीख के बगल में सभी तिथियां और सभी पाठ। यदि नहीं, तो ऐसा करने का सबसे अच्छा तरीका क्या होगा? नियमित अभिव्यक्ति? मैंने सुना है कि NSString
में इसके लिए पहले से ही अंतर्निहित विधियां हो सकती हैं। क्या ये सच है?स्क्रैपिंग और एक विकिपीडिया को पार करना पृष्ठ
मैं यह देखने के लिए चारों ओर देख रहा था कि स्क्रैपिंग के लिए कोई विकल्प था, जैसे एक्सएमएल फ़ाइल या एपीआई। मुझे एक एपीआई मिली लेकिन केवल एकमात्र ग्राहक जो मैं देखता हूं वह अन्य भाषाओं में हैं और वे केवल पृष्ठों पर सामग्री पोस्ट करने में सक्षम हैं, इसे पुनर्प्राप्त नहीं करते हैं।
संपादित: तो मैं इन कड़ियों में एपीआई के बारे में अधिक जानकारी पाया:
और मैं this request जो कुछ HTML रिटर्न साथ आने के लिए सक्षम था एन्कोडेड टेक्स्ट (वैसे प्रारूप एक्सएमएल है, लेकिन इसमें पेज का टेक्स्ट शामिल है जैसे कि »a href=
इत्यादि। मैं दस्तावेज़ों को देखकर देख सकता हूं कि क्या मैं कर सकता हूं ई यह थोड़ा बेहतर हो गया है, अगर नहीं, तो क्या इसे पार्स करने पर कोई सिफारिशें हैं?
संपादित 2: ठीक है तो this doc page करने के लिए धन्यवाद, सरल और स्पष्ट तरीका मैं डेटा पुनः प्राप्त कर लिया है इस constructed link जो कच्चे डेटा रिटर्न (विकि मार्कअप में) प्रासंगिक अनुभाग का उपयोग कर रहा है। हालांकि, मुझे लगता है कि मुझे उस पर विश्लेषण करने की आवश्यकता होगी, हालांकि अगर यह वास्तव में मामला है, तो यह पूरे लेख की तुलना में बहुत आसान होना चाहिए।
क्या किसी के पास उद्देश्य-सी में निम्नलिखित विकी मार्कअप को पार्स करने पर कोई अनुशंसाएं हैं?
==Events==
* [[710]] – [[Saracen]] invasion of [[Sardinia]].
*[[1275]] – Traditional founding of the city of [[Amsterdam]].
*[[1682]] – [[Philadelphia]], [[Pennsylvania]] is founded.
मैं क्या है होने अंत करना चाहते हैं, मैं एक NSDictionary
या इसी तरह के संग्रह है कि जानकारी के साथ स्निपेट के साथ तारीख स्टोर करेगा लगता है। धन्यवाद!
इसके लिए धन्यवाद, मैं इसकी सराहना करता हूं। मुझे लगता है कि जिस तरह से मैं जा रहा हूं (एकमात्र तरीका मैं इसे करने के लिए देख सकता हूं) कच्चे डेटा का थोड़ा सा हो रहा है और फिर किसी भी तरह से इसे पार्स कर रहा है। मैंने उपर्युक्त डेटा का एक उदाहरण शामिल किया है, हालांकि मैं इसके लिए एक नया प्रश्न बनाउंगा। –
वह नया डेटा पार्स करने के लिए बहुत आसान है - मैं स्ट्रिंग रेंज की तलाश करके इसे संभालता हूं जो घटनाओं के बाद शुरू होता है, फिर लाइन के अंत तक ndash के बाद कुछ भी के साथ ब्रैकेट शुद्ध संख्याओं के खिलाफ एक मैच कर रहा है .. तो आपको बस सभी "[" और "]" अक्षरों को बाहर करने की आवश्यकता होगी और आप सभी सेट हो जाएंगे। एचटीएमएल की तुलना में प्रक्रिया करना आसान है, हालांकि सुपर लिंक भारी है। –
धन्यवाद, क्या आप पार्सिंग के संबंध में मेरे बाद के प्रश्न का उत्तर देना चाहते हैं? http://stackoverflow.com/questions/1634012/how-to-parse-some-wiki-markup धन्यवाद! –