2015-03-21 11 views
5

से अनन्य शब्दों को कैसे ढूंढें मेरे पास एक बड़ी फ़ाइल है, teh लाइनें इस टेक्स्ट नंबर इत्यादि की तरह दिखती हैं [मैन- (कुछ अंक)] इस मैन-सोमनबर्स को बहुत कुछ दो पंक्तियों में दोहराया जाता है, मैं चाहता हूं केवल अद्वितीय Mans -words गिनने के लिए। मैं अद्वितीय फ़ाइल का उपयोग नहीं कर सकता, क्योंकि प्रत्येक शब्द में मैन शब्द से पहले पाठ हमेशा अलग होता है। मैं फ़ाइल में केवल अद्वितीय मैन-somenumbers शब्दों को कैसे गिन सकता हूं?फ़ाइल लिनक्स

+0

'grep' और' wc' या 'lc' का संयोजन एक अच्छी शुरुआत होना चाहिए। – arkascha

उत्तर

6

तो मैं समझता हूँ कि क्या आप सही तरीके से करना चाहते हैं, तो

grep -oE 'Man-[0-9]+' filename | sort | uniq -c 

चाल करना चाहिए। यह काम करता है इस प्रकार है: सबसे पहले

grep -oE 'Man-[0-9]+' filename 

फ़ाइल से सभी शब्दों है कि Man-[0-9]+ रेगुलर एक्सप्रेशन से मेल को अलग कर देता। uniq की क्रमबद्ध सूची प्राप्त करने के लिए उस सूची को sort के माध्यम से पाइप किया जाता है, और उसके बाद उस क्रमबद्ध सूची को uniq -c के माध्यम से पाइप किया जाता है ताकि यह पता चल सके कि प्रत्येक अद्वितीय Man- शब्द कितनी बार प्रकट होता है।

+0

यह बिना विकल्प के भी काम किया। जब इस्तेमाल किया गया- तो विकल्प यह अमान्य विकल्प कहा। मैं विंडोज़ का उपयोग कर रहा हूं और जीआईटी इंस्टॉलेशन से जीआईटी बाश के अंदर कमांड का उपयोग कर रहा हूं। –

संबंधित मुद्दे