को छोड़कर सभी विराम चिह्नों को खत्म करें मेरे पास निम्न रेगेक्स है जो किसी भी स्थान या विराम चिह्न पर विभाजित है। मैं :punct:
से 1 या अधिक विराम चिह्नों को कैसे बहिष्कृत कर सकता हूं? मान लीजिए कि मैं एस्ट्रोफ़ेस और कॉमा को बाहर करना चाहता हूं। मुझे पता है कि मैं [[:punct:]]
के बजाय स्पष्ट रूप से [all punctuation marks in here]
का उपयोग कर सकता हूं लेकिन मैं एक बहिष्करण विधि की उम्मीद कर रहा हूं।रेगेक्स;
X <- "I'm not that good at regex yet, but am getting better!"
strsplit(X, "[[:space:]]|(?=[[:punct:]])", perl=TRUE)
[1] "I" "'" "m" "not" "that" "good" "at" "regex" "yet"
[10] "," "" "but" "am" "getting" "better" "!"
मेरा सिर दर्द होता है ... –