मैं फ़ाइलों के संग्रह से शब्दों का शब्दकोश बनाने की कोशिश कर रहा हूं। फ़ाइल में सभी शब्दों को प्रिंट करने का एक आसान तरीका है, प्रति पंक्ति एक?फ़ाइल से निकालें
उत्तर
आप grep
इस्तेमाल कर सकते हैं एक बार प्रत्येक शब्द, मामले को अनदेखा करते हुए, आपका उपयोग कर सकते हैं
-u
केवल प्रत्येक शब्द जब शब्द
# if you only want each word once % grep -o -E '\w+' temp | sort -u -f adipiscing amet brown consectetur dog dolor elit example examples for fox ipsum jumped lazy Lorem over quick rather sit Some text than The use
धन्यवाद! मैं इसके लिए एक घंटे के लिए Google रहा हूँ। आश्चर्यजनक रूप से, "... दस्तावेज़ से" का उपयोग करके "...एक टेक्स्ट फ़ाइल से "मुझे यह प्रश्न पहले मैच के रूप में लाया – davka
आप ----> grep -o -E '\ w +' testfile.txt | sort -u -f | tee 5.txt <---- फ़ाइल को –
जैक यांग में आउटपुट करने के लिए: या केवल सामान्य खोल रीडायरेक्ट 'grep ... | sort -u -f> 5.txt' का उपयोग करें – rampion
एक अच्छी शुरुआत बस -u
(uniquify) ध्वज के साथ तो, sed
उपयोग करने के लिए नई-पंक्तियों के साथ सभी रिक्त स्थान को बदलने के लिए बाहर खाली लाइनें (फिर sed
के साथ) पट्टी, sort
, डुप्लिकेट को निकालने के इस उदाहरण में है:
$ echo "the quick brown dog and fox jumped
over the lazy dog" | sed 's/ /\n/g' | sed '/^$/d' | sort -u
and
brown
dog
fox
jumped
lazy
over
quick
the
फिर आप विराम चिह्न और पसंद के बारे में चिंता करना शुरू कर सकते हैं।
संभालने सफेद रिक्ति द्वारा अलग किए शब्द
awk '{for(i=1;i<=NF;i++)print $i}' file
या
tr ' ' "\n" < file
आप विशिष्टता चाहते हैं:
awk '{for(i=1;i<=NF;i++)_[$i]++}END{for(i in _) print i}' file
tr ' ' "\n" < file | sort -u
कुछ हटा विराम चिह्न के साथ
। शब्द
-o
के लिए
-E '\w+'
खोजें केवल लाइन है कि
% cat temp Some examples use "The quick brown fox jumped over the lazy dog," rather than "Lorem ipsum dolor sit amet, consectetur adipiscing elit" for example text. # if you don't care whether words repeat % grep -o -E '\w+' temp Some examples use The quick brown fox jumped over the lazy dog rather than Lorem ipsum dolor sit amet consectetur adipiscing elit for example text
से मेल खाता है के भाग प्रिंट आप केवल प्रिंट करना चाहते हैं:
awk '{
gsub(/["*^&()#@$,?~]/,"")
for(i=1;i<=NF;i++){ _[$i] }
}
END{ for(o in _){ print o } }' file
Ken Church's "Unix(TM) for Poets" (PDF) वास्तव में आवेदन के इस प्रकार का वर्णन करता है की तुलना में एक बार
-f
बताता sort
मामले की अनदेखी करने के प्रिंट - निकालने शब्द पाठ फ़ाइलों से बाहर, छंटाई और उन्हें गिनना, आदिtr कमांड यह कर सकता है ...
tr [:blank:] '\n' < test.txt
यह टीआर प्रोग्राम को नई जगह के साथ सफेद स्थान को बदलने के लिए कहता है।
tr [:blank:] '\n' <test.txt> result.txt
देखें here: उत्पादन stdout result.txt है, लेकिन यह एक और फ़ाइल पर पुनः निर्देशित किया जा सकता है,।
- 1. संशोधित प्रतिबद्धता से फ़ाइल निकालें
- 2. plupload कतार से फ़ाइल निकालें?
- 3. फ़ाइल फ़ाइल डिस्क्रिप्टर से फ़ाइल फ़ाइल निकालें या FILE *
- 4. exe फ़ाइल से VB.NET कोड निकालें
- 5. विंडोज .lnk (शॉर्टकट) फ़ाइल से आइकन निकालें
- 6. टेक्स्ट फ़ाइल की पंक्तियों से डेटा निकालें
- 7. गुंजिप/फ़ाइल को "भाग से भाग" निकालें
- 8. फ़ॉन्ट फ़ाइल से अक्षर कैसे निकालें?
- 9. Mercurial: सभी परिवर्तनों से फ़ाइल निकालें
- 10. टेक्स्ट फ़ाइल से डुप्लिकेट लाइन्स निकालें?
- 11. एपीके फ़ाइल से ऐप आइकन निकालें
- 12. एक धार फ़ाइल से SHA1 हैश निकालें
- 13. cover.py से फ़ाइल को कैसे बाहर निकालें?
- 14. tar.gz से एक फ़ाइल निकालें, डिस्क
- 15. बैच फ़ाइल इनपुट से ट्रेलिंग स्लैश निकालें
- 16. पीई फ़ाइल से डीओएस स्टब निकालें
- 17. फ़ाइल से xml तत्व को कैसे निकालें?
- 18. जार फ़ाइल से गुण फ़ाइल को कैसे निकालें?
- 19. निकालें '\' से #
- 20. बैच फ़ाइल - दूसरा फ़ाइल एक्सटेंशन निकालें
- 21. संग्रह से फ़ाइल निकालें लेकिन इसे स्थानीय रूप से रखें
- 22. वर्कस्पेस से हटाए बिना पर्सफोर्स नियंत्रण से एक फ़ाइल निकालें?
- 23. निकालें चयनित फ़ाइल (रों) जावास्क्रिप्ट
- 24. पर्यावरण चर से पथ निकालें
- 25. रूबी नेट :: एफ़टीपी, ftp.list से फ़ाइल नाम निकालें()
- 26. Mercurial - संस्करण नियंत्रण से फ़ाइल को कैसे निकालें?
- 27. DotNetZip लाइब्रेरी द्वारा प्रोग्रामेटिक रूप से ज़िप फ़ाइल निकालें?
- 28. किसी फ़ाइल से बाइट ऑर्डर मार्क निकालें। रीडअल्टबाइट्स (बाइट [])
- 29. फ़ाइलइटेम के नाम से केवल फ़ाइल नाम निकालें
- 30. पर्ल में, फ़ाइल से^एम को कैसे निकालें?
क्या आपको एक निश्चित प्रोग्रामिंग भाषा की आवश्यकता है? – mkmurray
@mkmurray, "खोल", "स्क्रिप्टिंग" और "यूनिक्स" आमतौर पर मानक यूनिक्स बक्से - awk, grep, sed, perl, कट आदि पर उपलब्ध किसी भी उपकरण का अर्थ है। – paxdiablo