तो मेरे पास सड़क के पते वाले डेटासेट हैं, वे बहुत अलग रूप से स्वरूपित हैं। उदाहरण के लिए:पहले नंबर पर केवल स्ट्रिंग को कैसे विभाजित करें
d <- c("street1234", "Street 423", "Long Street 12-14", "Road 18A", "Road 12 - 15", "Road 1/2")
इससे मैं दो कॉलम बनाना चाहता हूं। 1. एक्स: सड़क के पते और के साथ 2. वाई: नंबर + के साथ जो कुछ भी है। इस तरह:
X Y
Street 1234
Street 423
Long Street 12-14
Road 18A
Road 12 - 15
Road 1/2
अब तक मैं strsplit की कोशिश की और यहाँ कुछ इसी तरह के सवाल पीछा किया, उदाहरण के लिए है: strsplit(d, split = "(?<=[a-zA-Z])(?=[0-9])", perl = T))
। मुझे सही नियमित अभिव्यक्ति नहीं मिल रही है।
किसी भी मदद की अत्यधिक सराहना की जाती है। आपका अग्रिम में ही बहुत धन्यवाद!
'do.call ('rbind', strsplit (डी, split =" (? <= [A-zA-Z]) \\ s * (? = [0-9]) ", perl = सही)) ' – Sathish
@ साथिश: हाँ, लेकिन चलो ओपी के लिए कुछ छोड़ दें। प्रश्न में कोई डेटा फ्रेम पीढ़ी से संबंधित कोड नहीं है, यह सब रेगेक्स के बारे में है। –
सभी मदद के लिए धन्यवाद। अंत में मैंने प्रदान की गई regex के साथ colsplit का उपयोग किया और उसके बाद उन्हें मौजूदा डेटासेट में बाध्य कर दिया। समाधान फार्म सतीश बहुत अधिक सुरुचिपूर्ण है, धन्यवाद। – Jesse