मैं एक रेगेक्स की तलाश में हूं जो विराम चिह्न और सफेद स्थान को छोड़कर वाक्य में पहले शब्द से मेल खाता है। उदाहरण के लिए: "यह" में "यह एक वाक्य है।" ! और "सबसे पहले" में नमस्कार \ ""रेगेक्स वाक्य में पहले शब्द से मिलान करने के लिए
यह काम नहीं करता "सबसे पहले, मैं कहना है \ चाहते हैं":
"""([A-Z].*?(?=^[A-Za-z]))""".r
रेगेक्स का क्या स्वाद है? –
क्या शब्दों में संख्याएं हो सकती हैं? – endy
'([az] +) ', केस-असंवेदनशील," गैर-मुश्किल "अंग्रेजी के लिए पर्याप्त होना चाहिए .. हालांकि, यह गैर-लैटिन वर्णों के लिए जल्दी से विफल हो जाएगा - इसलिए [यूनिकोड वर्ण वर्गों का उपयोग करें] (http: //stackoverflow.com/a/5005122/166390) उपयुक्त के रूप में! ध्यान दें कि यह एक एनएफए रेगेक्स (रूबी: डी) जैसा मानता है जो "पहली चीज़ से मेल खा सकता है", लेकिन यह यहां पक्ष में काम करता है क्योंकि एंकर या अन्यथा जटिल दिखने की आवश्यकता नहीं है। –