pdf-scraping

    8गर्मी

    2उत्तर

    पायथन में मैं इस संदेश के नीचे दिए गए कोड के साथ पीडीएफ से पाठ पढ़ने के लिए pdfminer का उपयोग कर रहा हूं। जब मैं के साथ एक्रोबेट प्रो इस पीडीएफ खोलने यह पता चला है कि यह (या "संरक्षित पढ़ें") सुरक्षित

    5गर्मी

    2उत्तर

    का उपयोग कर पीडीएफ तालिका को पहचानें मैं कुछ पीडीएफ रिपोर्ट के अंदर तालिकाओं से डेटा निकालने की कोशिश कर रहा हूं। मैंने पीडीएफटोल्स और इसी तरह के पैकेज का उपयोग करके कुछ उदाहरण देखे हैं, मैं पाठ प्राप

    25गर्मी

    3उत्तर

    क्या कोई खुली स्रोत लाइब्रेरी है जो टेबल पहचान & निष्कर्षण का समर्थन करती है? इस से मेरा मतलब है: पहचानें एक मेज संरचना मौजूद है वर्गीकृत इसकी सामग्री से मेज एक उपयोगी उत्पादन प्रारूप में मेज से निकाल