मेरे पास एक HTML और आर कोड है और प्रत्येक नोड मान को अपने मूल आईडी में डेटा.फ्रेम में जोड़ने की आवश्यकता है। प्रत्येक व्यक्ति के लिए कुछ अलग जानकारी उपलब्ध है।आर: साइट के समय पर मूल गुण और नोड मान कैसे प्राप्त करें?
example <- "<div class='person' id='1'>
<div class='phone'>555-5555</div>
<div class='email'>[email protected]</div>
</div>
<div class='person' id='2'>
<div class='phone'>123-4567</div>
<div class='email'>[email protected]</div>
</div>
<div class='person' id='3'>
<div class='phone'>987-6543</div>
<div class='age'>32</div>
<div class='city'>New York</div>
</div>"
doc = htmlTreeParse(example, useInternalNodes = T)
values <- xpathSApply(doc, "//*[@class='person']/div", xmlValue)
variables <- xpathSApply(doc, "//*[@class='person']/div", xmlGetAttr, 'class')
id <- xpathSApply(doc, "//*[@class='person']", xmlGetAttr, 'id')
# The problem: create a data.frame(id,variables,values)
xpathSApply()
के साथ, मैं फोन, ईमेल, और उम्र मूल्यों के रूप में अच्छी तरह से व्यक्ति जिम्मेदार बताते हैं (आईडी) भी रूप में प्राप्त कर सकते हैं। हालांकि, उन जानकारी को अलग कर दिया गया है और मुझे उन्हें सही डेटा.फ्रेम चर और सही व्यक्ति को संदर्भित करने की आवश्यकता है। मेरे वास्तविक डेटा में बहुत सारी जानकारी हैं, इसलिए प्रत्येक चर नामकरण की यह प्रक्रिया स्वचालित होनी चाहिए।
मेरा लक्ष्य डेटा आईडी बनाना है जैसे प्रत्येक आईडी को अपने उचित डेटा से संबंधित करना।
id variables values
1 1 phone 555-5555
2 1 email [email protected]
3 2 phone 123-4567
4 2 email [email protected]
5 3 phone 987-6543
6 3 age 32
7 3 city New York
मेरा मानना है कि मैं xpathSApply
अंदर उपयोग करने के लिए जो एक ही समय व्यक्ति फोन और व्यक्ति आईडी पर मिलेगा एक समारोह बनाना होगा, ताकि वे संबंधित हो जाएगा, लेकिन मैं के साथ किसी भी सफलता नहीं किया है अब तक
किसी को भी मेरी मदद कर सकते हैं?