मेरी डेटा:कब्जा जटिल नाम
Caterina Guonçallvez braçeyro
Francisco Ro[dr]í[gueJz luveyro
Johao de Miranda calçeteyro
Lucas Martinz Mal-Cuzinhado, braçeyro
Francisquo d[e] Arruda braçeyro
Francisquo de Miranda braçeyro
-first नाम अंतिम नाम
brakets और (मान्यता ओसीआर brakets) जम्मू
-first नाम हाइफ़न से अंतिम नाम के साथ -first नाम अंतिम नाम
-first brakets
अपेक्षित उत्पादन
साथ कण के साथ कण-first नाम अंतिम नाम के साथ अंतिम नाम नाम
Caterina Guonçallvez
Francisco Ro[dr]í[gueJz
Johao de Miranda
Lucas Martinz Mal-Cuzinhado
Francisquo d[e] Arruda
Francisquo de Miranda
नाम uppercases
नाम का अंतिम भाग एक अंतरिक्ष (या अंतरिक्ष के साथ अल्पविराम) द्वारा पीछा किया जाता के साथ शुरू कर रहे हैं और एक शब्द "braçeyro" या "calçeteyro की तरह किसी लोअरकेस वर्ण से शुरू "(लोगों की नौकरियां)
डेटा < - readLines (" क्लिपबोर्ड ", एन्कोडिंग =" latin1 ")
मैं क्या करने की कोशिश की:
^([a-zA-ZàáâäãåąčćęèéêëėįìíîïłńòóôöõøùúûüųūÿýżźñçčšžÀÁÂÄÃÅĄĆČĖĘÈÉÊËÌÍÎÏĮŁŃÒÓÔÖÕØÙÚÛÜŲŪŸÝŻŹÑßÇŒÆČŠŽ∂ð])\w+[A-Z ,.'-]\w+
देने
एंटोनियो Guomez
Caterina Guon
फ्रांसिस्को रो
Johao डी
Francisquo घ
आप उम्मीद पेस्ट कर सकते हैं उत्पादन? जैसा कि मुझे नहीं पता कि आखिरी नाम क्या है। भारत में हमारे यहां सरल अंतिम नाम है। – khrm
मैं 'str_extract (s," \\ p {Lu} [\\ w \\] \\ [-] * (?: (?: \\ s + d \\ [? E \\] का उपयोग करता हूं?)? \\ s + \\ p {Lu} [\\ w \\] \\ [-] *) * ") ', यह स्वीकार्य उत्तर का एक रैखिक संस्करण है (इस प्रकार तेज़ है) और साथ ही नामों से मेल खाता है कोई अपरकेस अक्षर। –