मैं कोड im का एक टुकड़ा nokogiri कि इस तरह दिखता है के साथ पार्स करने का प्रयास किया है पर सामग्री को विभाजित करने के लिए Nokogiri का उपयोग करना:बीआर टैग
<td class="j">
<a title="title text1" href="http://link1.com">Link 1</a> (info1), Blah 1,<br>
<a title="title text2" href="http://link2.com">Link 2</a> (info1), Blah 1,<br>
<a title="title text2" href="http://link3.com">Link 3</a> (info2), Blah 1 Foo 2,<br>
</td>
मैं कुछ इस तरह का उपयोग कर td.j के स्रोत की पहुंच है : data_items = doc.css("td.j")
मेरा लक्ष्य उन पंक्तियों में से प्रत्येक को हैश की सरणी में विभाजित करना है। एकमात्र तार्किक विभाजन बिंदु मैं देख सकता हूं कि बीआरएस पर विभाजित होना है और फिर स्ट्रिंग पर कुछ रेगेक्स का उपयोग करना है।
मैं सोच रहा था कि ऐसा करने के लिए शायद बेहतर तरीका है नोकोगिरी का उपयोग कर? यहां तक कि अगर मैं 3 लाइन वस्तुओं को चूसने के लिए नोकोगिरी का उपयोग कर सकता हूं, तो यह मेरे लिए चीजों को आसान बना देगा क्योंकि मैं केवल सामग्री पर कुछ रेगेक्स पार्सिंग कर सकता हूं।
यकीन नहीं है कि ब्रोक के साथ समाप्त होने वाली लाइनों को पकड़ने के लिए नोकोगिरी का उपयोग कैसे करें - क्या मुझे xpaths का उपयोग करना चाहिए? किसी भी दिशा की सराहना की है! धन्यवाद
यह मेरे लिए काम किया। बहुत बहुत धन्यवाद! –