मेरे पास पीडीएफ फाइलों का एक गुच्छा है और मेरे पर्ल प्रोग्राम को उन लोगों की एक पूर्ण-पाठ खोज करने की आवश्यकता है, जिनके पास एक विशिष्ट स्ट्रिंग है। तिथि करने के लिए मैं इस का उपयोग किया गया:मैं पर्ल से पीडीएफ फाइलों की पूर्ण-पाठ खोज कैसे कर सकता हूं?
my @search_results = `grep -i -l \"$string\" *.pdf`;
जहां $ स्ट्रिंग पाठ देखने के लिए है। हालांकि यह अधिकांश पीडीएफ के लिए विफल रहता है क्योंकि फ़ाइल प्रारूप स्पष्ट रूप से ASCII नहीं है।
मैं यह सबसे आसान क्या कर सकता हूं?
स्पष्टीकरण: लगभग 300 पीडीएफ हैं जिनका नाम मैं पहले से नहीं जानता। पीडीएफ :: कोर शायद अधिक है। मैं एक दूसरे के साथ अच्छा खेलने के लिए pdftotext और grep प्राप्त करने की कोशिश कर रहा हूं, मुझे पीडीएफ के नाम नहीं पता हैं, मुझे अभी तक सही वाक्यविन्यास नहीं मिल रहा है।
अंतिम समाधान नीचे एडम Bellaire के सुझाव का उपयोग कर:
@search_results = `for i in \$(ls); do pdftotext \$i - | grep --label="\$i" -i -l "$search_string"; done`;
हो सकता है कि आप "पर्ल से पीडीएफ पूर्ण-पाठ खोज" के लिए प्रश्न का नाम बदलना चाहें –