2011-02-04 31 views
5

मुझे एक पीडीएफ फ़ाइल पढ़ने और एक पाठ की खोज करने की आवश्यकता है। मुझे प्रदर्शित करना चाहिए कि कौन सा पृष्ठ मौजूद है और घटनाओं की संख्या है। मैं पाठ में पीडीएफ पढ़ सकता हूं लेकिन मुझे पेज नंबर जानने की जरूरत है।पीडीएफ पाठ खोज सी #

धन्यवाद

उत्तर

4

इस के लिए आप Docotic.Pdf का उपयोग कर सकते हैं (मैं बिट चमत्कार के लिए काम करता हूं)।

PdfDocument doc = new PdfDocument("file.pdf"); 
string textToSearch = "some text"; 
for (int i = 0; i < doc.Pages.Count; i++) 
{ 
    string pageText = doc.Pages[i].GetText(); 
    int count = 0; 
    int lastStartIndex = pageText.IndexOf(textToSearch, 0, StringComparison.CurrentCultureIgnoreCase); 
    while (lastStartIndex != -1) 
    { 
     count++; 
     lastStartIndex = pageText.IndexOf(textToSearch, lastStartIndex + 1, StringComparison.CurrentCultureIgnoreCase); 
    } 

    if (count != 0) 
     Console.WriteLine("Page {0}: '{1}' found {2} times", i, textToSearch, count); 
} 

आप IndexOf विधि के लिए तीसरा तर्क को दूर करने के लिए यदि आप केस-संवेदी खोज करने के लिए चाहते हैं कर सकते हैं:

यहाँ PDF में पाठ खोजने के लिए कैसे के लिए एक नमूना है।

+0

धन्यवाद बॉबरोव्स्की मैं इसे आजमाउंगा .. – dps123

+1

भावी पाठकों, डॉकॉटिक के लिए एफवाईआई के रूप में। पीडीएफ अब मुक्त नहीं है। http://bitmiracle.com/pdf-library/free-pdf-library.aspx मैं सुझाव देता हूं कि अपाचे पीडीएफबॉक्स को आज़माएं (यह पूरी तरह से नि: शुल्क है और इसकी रिलीज के बाद से) – Keplah

+0

मैंने अपना जवाब अपडेट कर दिया है। – Bobrovsky

3

आप iTextSharp बाहर जाँच की है? http://itextsharp.sourceforge.net/

संपादित करें: 15.3.3: PdfReaderContentParser और PdfTextExtractor

साथ निकाला जा रहा है पाठ

और तहत PdfReaderContentParser: विस्तार से बता दें टीओसी में, मैं एक खंड पर देखा http://api.itextpdf.com/com/itextpdf/text/pdf/parser/PdfReaderContentParser.html कार्रवाई करने के लिए एक विकल्प नहीं है प्रति पेज पीडीएफ सामग्री।

तो यह एक दौर के बारे में लगता है, लेकिन आप प्रत्येक पृष्ठ के माध्यम से फिर से शुरू कर सकते हैं, जो शब्द आप चाहते हैं उसके लिए सामग्री खोज रहे हैं और फिर उस पेज को वापस कर सकते हैं जिसे आपने पाया है।

+0

मुझे खोज विकल्प itextsharp दस्तावेज नहीं दिख रहा है। – Shoban

+0

@ शोबन ने अधिक जानकारीपूर्ण होने का उत्तर संपादित किया। मैंने इसे खुद से नहीं देखा है, ओपी शुरू करने के लिए सिर्फ एक सुझाव है। – Joe

+0

धन्यवाद जो ... :) +1 – Shoban

संबंधित मुद्दे