2013-01-22 15 views
6

पर एमएस ऑफिस स्थापित किए बिना सी # का उपयोग कर दस्तावेज़ और डॉक्क्स फ़ाइलों को पढ़ना, मैं एक प्रोजेक्ट (एएसपीनेट, सी #, वीबी 2010, नेट 4) पर काम कर रहा हूं और मुझे डीओसी और डॉक्सएक्स फाइलों को पढ़ने की जरूरत है, मैंने पहले से अपलोड किया है (मैंने अपलोड करने का हिस्सा किया है)। मुश्किल हिस्सा यह है कि मेरे पास सर्वर पर एमएस ऑफिस स्थापित नहीं है और मैं इसका उपयोग नहीं कर सकता।सर्वर

क्या कोई सार्वजनिक पुस्तकालय है जिसमें मैं कुछ भी इंस्टॉल किए बिना अपने प्रोजेक्ट में शामिल कर सकता हूं? दोनों डॉक्स बहुत सरल कर रहे हैं:

NUMBER TAB STRING 
NUMBER TAB STRING 
NUMBER TAB STRING 
... 

मैं प्रत्येक पंक्ति (पैराग्राफ) के लिए संख्या और स्ट्रिंग को निकालने के लिए की जरूरत है।

कोई इससे मदद कर सकता है? मुझे एक बार फिर दोहराना चाहिए कि मैं इस तरह से सीमित हूं कि मैं किसी सर्वर पर कुछ भी इंस्टॉल नहीं कर सकता।

+1

डॉक्टर और डॉक्क्स? डॉक्क्स एक्सएमएल दस्तावेजों और possibl बाइनरी (यदि छवियों में हैं आदि) की एक ज़िप शैली संपीड़ित संग्रह है, डॉक्टर बाइनरी कोडित है - पूरी तरह से अलग इंजन की जरूरत है। – TomTom

+0

डॉक्स के लिए मुफ्त और वाणिज्यिक पुस्तकालय हैं लेकिन डीओसी के लिए केवल एक ही विकल्प जो मुझे पता है वाणिज्यिक हैं ... क्या वाणिज्यिक पुस्तकालय एक विकल्प है? – Yahia

+0

@ टॉमटॉम हाँ मुझे पता है कि डॉक्टर और डॉक्क्स के लिए अलग-अलग पृष्ठभूमि है, लेकिन मुझे दिलचस्पी है अगर इसे किसी पुस्तकालय में विलय किया जा सकता है? या शायद दो पुस्तकालय हैं जिन्हें मैं बाद में अपने आप में विलय कर सकता हूं ... धन्यवाद – user1999722

उत्तर

4

डीओसी के लिए आप ओपन सोर्स लाइब्रेरी NPOI का उपयोग कर सकते हैं।

DOCX के लिए मैं सुझाव देंगे Open XML API

+0

आपके द्वारा प्रदान किए गए एनपीओआई लिंक के मुताबिक यह "समर्थन xls, xlsx, docx।" - डीओसी का कोई भी उल्लेख नहीं है !!! – Yahia

+0

@ याहिया एचएम ... वाणिज्यिक पुस्तकालय इतना अच्छा समाधान नहीं होगा। यदि आप किसी सार्वजनिक एक पता है, कि महान :) NPOI के रूप में हो सकता है, हाँ मैं भी देखा है कि यह डॉक्टर फ़ाइलों का समर्थन नहीं कर रहा है :( – user1999722

+0

अच्छी खबर है, अब यह दोनों 2003 और 2007 फ़ाइलों का समर्थन करता: "POI है एक ओपन सोर्स प्रोजेक्ट जो मदद कर सकते हैं पढ़ने/लिखने कार्यालय 2003/2007 फ़ाइलें "। और हाँ, डॉक स्थिर नहीं है (http://npoi.codeplex.com/discussions/360441) ... –

1

अद्यतन: NPOI docx अब समर्थन करता है। नवीनतम रिलीज (NPOI 2.0 बीटा)

2

आप Code7248.word_reader.dll

नीचे

उपयोग कर सकते हैं: प्रयास करें

अपनी परियोजना में इस DLL के संदर्भ में जोड़ सकते हैं और नकल कैसे Code7248.word_reader.dll

का उपयोग करने पर नमूना कोड है कोड के नीचे।

using System; 
using System.Collections.Generic; 
using System.Text; 
//add extra namespaces 
using Code7248.word_reader; 


namespace testWordRead 
{ 
    class Program 
    { 
     private void readFileContent(string path) 
     { 
      TextExtractor extractor = new TextExtractor(path); 
      string text = extractor.ExtractText(); 
      Console.WriteLine(text); 
     } 
     static void Main(string[] args) 
     { 
      Program cs = new Program(); 
      string path = "D:\Test\testdoc1.docx"; 
      cs.readFileContent(path); 
      Console.ReadLine(); 
     } 
    } 
} 
+0

क्या तुम जानते हो, जहां कर सकते हैं मैं इस DLL के लिए लाइसेंस देखने? दूसरों के लिए DLL के अपने लाइसेंस समर्थन वितरण करता है? – Demona

संबंधित मुद्दे