2014-10-05 6 views
6

मैं tesseract ocr में नए फोंट जोड़ने की कोशिश कर रहा हूं। मैं this tutorial का पालन कर रहा हूं लेकिन मुझे कुछ समस्याएं आ रही हैं।टेस्सेक्टैक्ट में नए फ़ॉन्ट्स जोड़ना 3

यहाँ मैं अब तक क्या किया है:

  1. बनाएं प्रशिक्षण दस्तावेज़

    convert eng.myfont.exp0.pdf eng.myfont.exp0.tif

  2. ट्रेन Tesseract

    tesseract eng.myfont.exp0.tif eng.myfont.exp0 batch.nochop makebox

    यह मेरा eng.myfont बनाया .exp0.box फ़ाइल।

    मैं फ़ाइल को मॉशिपेट के साथ खोलता हूं और सुनिश्चित करता हूं कि यह सही तरीके से पता चला है।

  3. बॉक्स फ़ाइल फ़ीड वापस Tesseract में

    tesseract eng.myfont.exp0.tif eng.myfont.exp0.box nobatch box.train.stderr

    मैं इस परिणाम है:

    Leptonica साथ Tesseract मुक्त स्रोत ओसीआर इंजन v3.03
    APPLY_BOXES:
    बक्से पढ़ बॉक्सफाइल से: 146
    मिला 146 अच्छे ब्लब्स।
    प्रशिक्षण ... फ़ॉन्ट का नाम = myfont.exp0
    जनरेट किया गया 6 शब्द

    • eng.myfont.exp0.box.tr फ़ाइल और eng.myfont.exp0.box.txt के लिए प्रशिक्षण डेटा उत्पन्न
  4. कोशिश चरित्र बॉक्स फ़ाइल में प्रयुक्त सेट का पता लगाने के लिए (यह वह जगह है जहाँ मैं अटक जाते हैं)

    unicharset_extractor *.box

परिणाम:

unicharset_extractor: आदेश नहीं मिला

मैं भी एक ही परिणाम के साथ unicharset_extractor eng.myfont.exp0.box tred।

मैं उपयोग कर रहा हूँ:

  • Tesseract 3.03
  • leptonica-1.70
  • libgif 4.1.6 (?): Libjpeg 8d: libpng 1.2.50: libtiff 4.0.3: zlib 1.2। 8: webp 0.4.0
  • उबंटू 14.04.1 LTS
+0

यह बहुत ही असाधारण है। इसका मतलब है कि आदेश नहीं मिल सकता है। मेरे सिस्टम पर मैं उस आदेश को '/ usr/local/bin/unicharset_extractor' में किसी भी मुद्दे के बिना ढूंढने में सक्षम हूं। – mlissner

उत्तर

6

Tesseract 3.03 आर सी के लिए प्रशिक्षण उपकरणों Ubuntu 14.04 से छोड़ दिया गया। तो या तो टेस्सेक्टैक्ट 3.02 पर वापस आएं या उबंटू 14.10 में अपग्रेड करें, जिसमें यह होना चाहिए।

+0

मुझे ओएस एक्स ईआई कप्तान 10.11.1 टर्मिनल में भी एक ही समस्या मिली है। मैंने नीचे दिए गए संस्करणों का उपयोग कर लिया है tesseract 3.04.01 लेप्टनिका-1.72 libjpeg 8d: libpng 1.6.21: libtiff 4.0.6: zlib 1.2.5 –

3

ठीक है, मैं तुम्हारे लिए इस googled।यहां जवाब है:

आपको उसी इनपुट फ़ोल्डर में सभी आदेशों को चलाने की आवश्यकता है जहां आपकी इनपुट फाइलें स्थित हैं।

से:

संबंधित मुद्दे