2012-11-02 22 views
9

पर मैं पीडीएफ फाइलों को संसाधित कर रहा हूं और जहां तक ​​संभव हो सके अक्षरों को यूनिकोड में परिवर्तित करना चाहता हूं। चरित्र सेट के गणितीय पीआई परिवार अपने स्वयं के प्रतीक नामों का उपयोग करते हैं (उदाहरण के लिए "एच 11001")।गणितीय पीआई प्रतीक नामों का रूपांतरण यूनिकोड

<chars> 
     <char charname="H11001" codepoint16="0X2B" codepoint="43" unicodeName="PLUS"/> 
     <char charname="H11002" codepoint16="0x2D" codepoint="45" unicodeName="MINUS"/> 
     <char charname="H11003" codepoint16="0XD7" codepoint="215" unicodeName="MULTIPLICATION SIGN"/> 
     <char charname="H11005" codepoint16="0X3D" codepoint="61" unicodeName="EQUALS"/> 
    </char> 

किसी को भी मुझे एक मौजूदा अनुवाद तालिका में इस तरह (सभी MathematicalPI सेट के लिए आदर्श) बात कर सकते हैं: अन्वेषण करके मैं की तरह (MathematicalPI-वन के लिए) एक टेबल का निर्माण किया है। [मैं ग्लिफ के ग्राफिकल डिस्प्ले को नहीं चाहता हूं क्योंकि इसका मतलब है कि प्रत्येक को यूनिकोड समकक्ष के रूप में देखा जाना चाहिए।]

यह भी एक समान प्रतीक संसाधन प्रतीत होता है जहां वर्णमाला सी 223 के रूप में हैं (कॉपीराइट के लिए)। इस पर किसी भी जानकारी की सराहना की जाएगी।

अद्यतन: मुझे @ user1808924 के उत्तर से कुछ अच्छी तरह से चाहिए - मैंने पहले से ही अपनी (आंशिक) अनुवाद तालिका से संकलित किया है, इसलिए यह निश्चित रूप से एक बनाना संभव है। गणितीय पीआई (सैकड़ों) में ग्लिफ की एक सूची को डाउनलोड और प्रदर्शित करना संभव है और यूनिकोड स्पेक बनाने के समकक्षों के माध्यम से जाना (और बहुमत के लिए मुझे लगता है कि स्पष्ट समकक्ष हैं)। एक संतोषजनक उत्तर में या तो सैकड़ों समकक्षों या एक डिफिंटिव स्टेटमेंट के साथ एक तालिका शामिल होगी जो यह फ़ॉन्ट निर्माता के कॉपीराइट का उल्लंघन करेगा।

अद्यतन: @minopret और @Miguel के बीच मैपिंग का निर्माण करना निश्चित रूप से संभव है। MathPi सेट अच्छी तरह से परिभाषित किए गए हैं - कुछ सौ - और आकार का बच्चा चित्रमय रूप से सर्वोत्तम ग्लाइफ ढूंढना आसान बनाता है। मानचित्रण निश्चित नहीं होगा (यानी एडोब के टिकट के साथ) लेकिन यह सार्थक होगा। और मुझे संदेह है कि ऐसे मामले होंगे जहां दो अलग-अलग ग्लिफ अनिवार्य रूप से समान हैं और इसलिए एक दृश्य मैपिंग काम नहीं करेगा - उदा। एक समतुल्य त्रिकोण वृद्धि या ग्रीक कैपिटल पत्र DELTA है?

मुझे संदेह है कि मैं व्यक्तिगत रूप से एक पूर्ण तालिका पूरी कर दूंगा - मुझे नहीं पता कि कुछ प्रतीकों का क्या अर्थ है। लेकिन मैं वैज्ञानिक तकनीकी चिकित्सा (एसटीएम) प्रकाशन में उपयोग किए जाने वाले एक सबसेट का उत्पादन करने की उम्मीद करता हूं।

@ user1808924 मैंने देखा है कि आपने SO पर अपने पहले दिन इसका उत्तर दिया था। बाउंटी प्रश्न सामान्य रूप से कठिन प्रश्नों के लिए (इस मामले में) की पेशकश की जाती है जहां एक निश्चित उत्तर होता है लेकिन यह खोजना मुश्किल होता है। जब तक आपके पास क्षेत्र का विशेषज्ञ ज्ञान न हो, तब तक राय या अनुमान लगाने के लिए आम तौर पर उपयोगी नहीं होता है।

+0

स्पष्ट करने के लिए, के रूप में छापना यूनिवर्सल गणितीय पाई फोंट का विरोध करने के आप, एडोब गणितीय पाई फोंट के बाद कर रहे हैं? – eh9

+0

मुझे पता नहीं था कि एक अंतर था! कोई स्पष्टीकरण मूल्यवान होगा। लेकिन * अगर * एक महत्वपूर्ण अंतर है कि मैं शायद एडोब पसंद करूंगा। संलेखन उपकरण में इसका उपयोग होने की अधिक संभावना है। –

+0

मुझे यकीन नहीं है कि, आपको दिमाग है, लेकिन इन चेहरे पर थोड़ा सा शोध कर रहा हूं, मैं इन दोनों के साथ स्पष्ट रूप से संबंधित, लेकिन स्पष्ट रूप से समान नहीं था। इससे भी ज्यादा भ्रमित, ऐसा लगता है कि लिनोटाइप कुछ समय पर एडोब फ़ॉन्ट का लेखक था, लेकिन यह देखते हुए कि लिनोटाइप ने उनका नाम बदल दिया है, मुझे यकीन नहीं है कि वे वही हैं। – eh9

उत्तर

2

यहाँ सबसे अच्छा जानकारी के रूप में अपने Typography forum message वहाँ में की एडोब मिगुएल सूज़ा द्वारा प्रदान की है:

के लिए क्या यह लायक है और जानकारी संक्षेप में प्रस्तुत करने कि मैंने इस उत्तर पर टिप्पणियों में जोड़ा था, यहां वह है जो मैं उससे पहले और उससे अलग करने में सक्षम था।

CTAN पर पैकेज "गणित" के निर्माता माइकल शार्प और यूसीएसडी गणित के सदस्य, this archive file में गणितीय पीआई के लिए टीएक्स परिभाषाएं हैं। मैंने सफलतापूर्वक अनुमान लगाया कि me.com पर अप्रचलित दस्तावेज स्थान अपनी विश्वविद्यालय साइट पर स्थानांतरित हो गया है। ".vf" फ़ाइलें गणितीय पीआई के अक्षरों को TeX गणित कोडपॉइंट्स पर मैप करती हैं। वे बाइनरी हैं। मैपिंग डेटा डंप का हिस्सा "vftovp" टूल का उपयोग करके पठनीय पाठ में है जो टीएक्स वितरण का हिस्सा है। कि डंप करने के बाद, हम पाते हैं कि मैप किए गए चरित्र:

mathpibb: 'hyphen-minus' 0-9 A-Z a-z 
mathpical: percent 'hyphen-minus' A-Z 
mathpifrak: 'hyphen-minus' 0-9 A-Z a-z 
mh2s: A-Z 

तो पैकेज नाम "mathalfa" बताते हैं कि। उन्होंने केवल वर्णमाला और अंकों को नियोजित करने का कार्य लिया लेकिन शायद ही कुछ और। हमें प्रतीकों के लिए मैपिंग के लिए उपरोक्त फ़ाइलों को देखना होगा।

मुझे लगता है कि इस तरह के MathPi 1 की ग्रीक अक्षरों के रूप में MathPi के कुछ हिस्सों,, के रूप में एडोब प्रतीक है, जो यहां से प्रलेखित है समान कूट का उपयोग करें: http://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt

जब अपने आप को यूनिकोड प्रतीकों को मैप करने का प्रयास, एक अच्छा तरीका यूनिकोड बिंदु स्क्रीन यहाँ पर ग्लिफ़ बनाकर है खोजने के लिए: (MathPI का उपयोग कर बनाए गए दस्तावेज़ों को पढ़ने से http://shapecatcher.com

+0

सूचक के लिए धन्यवाद। यह वही चीज है जो मैं चाहता हूं। ऐसा लगता है कि वहां बहुत आसानी से समझ में नहीं आता है और मैं इसे अपने वर्तमान रूप में उपयोग नहीं कर सकता। (फाइल बाइनरी हैं) अगर कोई एएससीआईआईआई में कुछ मैपिंग निकाल सकता है तो मुझे बक्षीस देने में खुशी होगी। –

+0

आपके अपडेट के लिए धन्यवाद। सबसे बुरे मामले में हमें मथपीआई (जो दस्तावेजों से सुलभ हैं, जो पूर्ण फ़ॉन्ट जानकारी का पर्दाफाश करते हैं) से ग्लाइफ टेबल के साथ बैठना होगा और हाथ से रूपांतरित करना होगा। कम से कम दूसरों को एक ही प्रक्रिया के माध्यम से जाना नहीं होगा। –

+0

बहुत उपयोगी। मैं मानता हूं कि ग्रीक मैपिंग वादा करता है (और विकिपीडिया में प्रतीक फ़ॉन्ट का पालन करता है)। एडोब मैपिंग बहुत उपयोगी है क्योंकि यह उन पात्रों की एक सूची भी देता है जो Adobe का उपयोग करने की संभावना है। यकीन नहीं है कि यह गणित समस्या हल करता है या नहीं। –

4

मुझे नहीं लगता कि ऐसी अनुवाद तालिका बिल्कुल उपलब्ध है।

यह मेरे लिए लग रहा है कि MathematicalPI फ़ॉन्ट परिवार एक कृत्रिम है, जो कुछ बड़े अज्ञात सेट से तत्वों का एक सबसेट का चयन करके तदर्थ बना दिया गया है है। MathematicalPI का राइस डी'एटर फ़ॉन्ट परिवार सरल बीजगणितीय ऑपरेटरों (प्लस, माइनस, गुणा, विभाजन) और बराबर चिह्न का प्रतिनिधित्व प्रतीत होता है। Charnames (यानी H1100X) कलाकृतियों के रूप में दिखाई देते हैं, क्योंकि उन्हें कोडपॉइंट मानों के बाद आदेश नहीं दिया जाता है (उदाहरण के लिए बराबर चिह्न अंतिम है)।

उपलब्ध डेटा को देखकर, मैं सुझाव दे सकता हूं कि गायब H11004 चर्नम विभाजन प्रदाता से मेल खाना चाहिए। हालांकि, यह अनुमान करना असंभव है कि क्या इसे यूनिकोड "ठोस" चरित्र (यानी U+002F), "विभाजन चिह्न" वर्ण (यानि U+00F7), या कुछ और द्वारा दर्शाया जाना चाहिए।

+0

गणितीय पीआई आपके सुझाव से बेहतर परिभाषित है। मैं पहले से ही बहुत आगे गया हूं और सेट में कुछ 10 अंक खोजे हैं। गणितीय पीआई में मानक glpyhs है और यह स्पष्ट है कि H11004 एक विभाजन संकेत के अनुरूप है, एक ठोस नहीं। ऐसा लगता है कि किसी ने एक टेबल बनाया है जहां (कहें) H11004 को यू +00 एफ 7 में निकटतम समकक्ष के रूप में मैप किया गया है और यह वह था जिसे मैं पूछ रहा था। –

+0

@ minopret के उत्तर को देखें - निश्चित रूप से मैपिंग –

1

FWIW मेरे वर्तमान मानचित्रण मेज, है:

<codePoint name="H9251" unicode="U+03B1" unicodeName="GREEK LOWERCASE LETTER ALPHA"/> 
<codePoint name="H9252" unicode="U+03B2" unicodeName="GREEK LOWERCASE LETTER BETA"/> 
<codePoint name="H9253" unicode="U+03B3" unicodeName="GREEK SMALL LETTER GAMMA"/> 
<codePoint name="H9254" unicode="U+03B4" unicodeName="GREEK SMALL LETTER DELTA"/> 
<codePoint name="H9255" unicode="U+03B5" unicodeName="GREEK SMALL LETTER EPSILON"/> 
<codePoint name="H9256" unicode="U+03B6" unicodeName="GREEK SMALL LETTER ZETA"/> 
<codePoint name="H9257" unicode="U+03B7" unicodeName="GREEK SMALL LETTER ETA"/> 
<codePoint name="H9258" unicode="U+03B8" unicodeName="GREEK SMALL LETTER THETA"/> 
<codePoint name="H9259" unicode="U+03B9" unicodeName="GREEK SMALL LETTER IOTA"/> 
<codePoint name="H9260" unicode="U+03BA" unicodeName="GREEK SMALL LETTER KAPPA"/> 
<codePoint name="H9261" unicode="U+03BB" unicodeName="GREEK SMALL LETTER LAMBDA"/> 
<codePoint name="H9262" unicode="U+03BC" unicodeName="GREEK LOWERCASE LETTER MU"/> 

<codePoint name="H11001" unicode="U+002B" decimal="43" unicodeName="PLUS"/> 
<codePoint name="H11002" unicode="U+002D" decimal="45" unicodeName="MINUS"/> 
<codePoint name="H11003" unicode="U+00D7" decimal="215" unicodeName="MULTIPLICATION SIGN"/> 
<codePoint name="H11005" unicode="U+003D" decimal="61" unicodeName="EQUALS"/> 
<codePoint name="H11011" unicode="U+007E" decimal="126" unicodeName="TILDE"/> 
<codePoint name="H11021" unicode="U+003C" decimal="60" unicodeName="LESS" htmlName="lt"/> 
<codePoint name="H11022" unicode="U+003E" decimal="62" unicodeName="" htmlName="gt"/> 
<codePoint name="H11032" unicode="U+0027" decimal="39" unicodeName="APOSTROPHE" htmlName="apos"/> 
<codePoint name="H11034" unicode="U+00B0" decimal="176" unicodeName="DEGREE SIGN" htmlName="deg"/> 

<codePoint name="H11554" unicode="U+00B7" decimal="183" unicodeName="MIDDLE DOT"/> 

3

यहाँ है कि मैं क्या Adobe Forums साइट पर प्रकाशित है:

मैं गलत हो सकता है, लेकिन मैं एक आधिकारिक पत्राचार तालिका वहाँ नहीं लगता।

छः प्रकार 1 फोंट और ओपनटाइप फ़ॉन्ट का उपयोग करके, जो मैंने बनाया था, मैंने दो पीडीएफ एकत्र किए हैं जो सभी ग्लिफ दिखाते हैं। उनके आगे ग्लाइफ नाम हैं (टाइप 1 फोंट के लिए) और यूनिकोड मान (ओपनटाइप फ़ॉन्ट के लिए)। यदि आप इन दो पीडीएफ को संदर्भित करते हैं, तो आप उस सहसंबंध सूची को इकट्ठा करने में सक्षम होना चाहिए जिसे आप ढूंढ रहे हैं।

Mathematical Pi

आशा इस मदद करता है।

मिगुएल

+0

इस घटना में पूर्ण उत्तर देने के लिए अच्छा हो सकता है कि लिंक भविष्य में कभी-कभी टूट जाए। – Marvo

+0

बहुत उपयोगी। समस्या अच्छी तरह से परिभाषित और tractable है। कुछ ग्लिफ स्पष्ट हैं और अब आकृतिकेटर दुर्लभ ग्लिफ की पहचान करने में सक्षम है, यह कुछ पुराने कामों के माध्यम से मैपिंग –

+1

बीटीडब्लू का निर्माण करने के लिए कुछ घंटों का काम है, मुझे कुछ मोनोटाइप कॉर्पोरेशन लिमिटेड से मुलायम पुस्तक मिली है जिसका शीर्षक है "सूची गणितीय पात्र - 'मोनोटाइप' 4-पंक्ति गणित श्रृंखला 56 9 और एल 231 "। इस पर कोई तारीख नहीं है, लेकिन मुझे लगता है कि यह 1 9 70 के दशक से है। इस पुस्तक में सूचीबद्ध कई वर्ण उन नामों का उपयोग करते हैं जिनका उपयोग टाइप 1 फोंट द्वारा भी किया जाता है। इन नामों को मैट्रिक्स नंबर कहा जाता है। मेरा मानना ​​है कि मोनोटाइप इन नामों/कोडों का स्रोत है। –

संबंधित मुद्दे