2008-12-06 13 views
5

मैं कुछ पाठ एक पृष्ठ पर रखना चाहता हूं और उस पाठ में कुछ डेटा छिपाना चाहता हूं। क्या किसी को इस समस्या को हल करने के लिए अतीत में इस्तेमाल किए गए किसी भी तरीके/पैटर्न के बारे में पता है?क्या आप टेक्स्ट में डेटा छिपा सकते हैं?

उदाहरण: मेरे पास निम्न पाठ है: "बिल्ली कुत्ते पर बैठी और खुश थी।"

मेरे पास 123 नंबर भी है। मैं इस वाक्य को उस वाक्य में छिपाना चाहता हूं जैसे कि वाक्य को वेब पेज पर रखा जा सकता है और केवल किसी को पता है कि वह डेटा ढूंढ पाएगा।

उत्तर

4

एचटीएमएल वास्तव में ऐसा करने में काफी आसान बनाता है। स्टेग्नोग्राफ़ी की वास्तव में चालाक मात्रा की कोई ज़रूरत नहीं है, चलिए देखते हैं:

यह वाक्य 123 को एम्बेड करता है और फिर एम्बेडिंग रोकता है।

यह वाक्य 0102 एम्बेड करता है और फिर एम्बेडिंग रोकता है।

(हम क्या यह वास्तव में markdown में काम करता है देखने के लिए होगा, लेकिन मैं बहुत संदेह है।) माना कि यह अगर आप जानते हैं यह है कि कुछ देखने के लिए बहुत स्पष्ट है, लेकिन मुझे लगता है कि आप इसे इस बात से सहमत हूँ नहीं स्पष्ट है आकस्मिक पर्यवेक्षकों के लिए।

मैंने इसे योजना के लिए एक छोटी सी पहेली के रूप में छोड़ दिया है, लेकिन यदि आप इसे स्पष्ट रूप से समझाया जाना चाहते हैं तो एक टिप्पणी जोड़ें।

+0

यदि आप ऐसा करते हैं तो अपने HTTP सर्वर पर संपीड़न को सक्षम करना सुनिश्चित करें! –

+1

हां, यदि आप डेटा की महत्वपूर्ण मात्रा में संचारित कर रहे हैं तो यह कुछ हद तक कमजोर हो सकता है। –

-1

ठीक है, आप this जैसे कुछ कोशिश कर सकते हैं ... सुनिश्चित नहीं है कि यह वही है जो आप खोज रहे हैं।

0

एक एल्गोरिदम हो सकता है जो उस वाक्य को 123 में बदल सकता है, लेकिन मुझे लगता है कि सामान्य रूप से आपको पाठ में कुछ संशोधन स्वीकार करने की आवश्यकता होगी यदि आपको किसी भी संभावित संख्यात्मक मूल्य को स्टोर करने की आवश्यकता है!

1

मुझे लगता है कि आप कुछ स्टेग्नोग्राफ़ी कहा जाता है के लिए देख रहे हैं। कोरिन्ना जॉन के पास कोडप्रोजेक्ट पर विषय पर लेखों का एक उत्कृष्ट संग्रह है।

http://www.codeproject.com/script/Articles/MemberArticles.aspx?amid=475133

+0

जोड़ने के लिए .. यदि आप कोडप्रोजेक्ट पर दिए गए लिंक का पालन करते हैं, तो आप उसके होमपेज पर पहुंच जाएंगे .. जो डू-इट स्वयं स्टेग्नोग्राफ़ी पर केंद्रित लगता है ... http: //www.binary-universe.net/ – torial

9

बेशक यह किया जा सकता है।

जो आप वर्णन कर रहे हैं वह व्यापक वर्णन में है Steganography

उदाहरण के लिए, आप इस तरह से एक संख्या है कि आप शब्दों की संख्या की गिनती जब तक आप पत्र बी, जो मामले में 123 के रूप में एन्कोड किया जा सकता है देखने के सांकेतिक शब्दों में बदलना हो सकता है:

You belong to the beautiful group of people being elite. 

बात है, जो व्यक्ति संदेश को डीकोड करना चाहता है उसे आपके एल्गोरिदम को अवश्य जानना चाहिए।

संपादित करें मुझे पता है कि मेरी संख्या एक से बंद है। 0 पर गिनना शुरू करें और आपको 123 नंबर दिखाई देगा।

0

यदि 'टेक्स्ट' वास्तव में एक छवि थी, तो आप उसमें डेटा को steganography का उपयोग करके छुपा सकते हैं - डेटा को बाइनरी छवि फ़ाइल में छिपाने के बिना छिपा हुआ है छवि दिखती है।

+1

छवियों में डेटा छिपाना स्टेग्नोग्राफ़ी की केवल एक शाखा है। –

0

इस thread के अनुसार:

प्रो Mikhail Atallah एट। अल। यहां पर्ड्यू ने watermarking text पर बहुत सारे शोध किए।

दृष्टिकोण टीएमआर (Text Meaning Representation) का उपयोग करता है ताकि परिभाषित कैननिकल रूप से एक निश्चित दूरी पर टीएमआर की स्थिति में मामूली परिवर्तन करके बिट्स को एन्कोड किया जा सके।

यह एक और तरीका है, पाठ के भीतर पाठ छिपाने के लिए अन्य उत्तर में वर्णित Steganograph विधि के साथ हो सकता है (वॉटरमार्क के लिए पाठ presented here है एक और तरीका)।

3

इस समस्या के लिए बहुत जटिल दृष्टिकोण हैं, हालांकि आप शायद एक बहुत ही सरल के साथ जा सकते हैं। जैसे प्रत्येक संख्या के लिए एक विशेषण परिभाषित करें:

0. beautiful 
1. harmless 
2. evil 
3. colorful 
4. weird 

और इसी तरह। अब अपनी पसंद के वाक्यों का चयन करें और धारकों को उन वाक्यों में रखें जहां विशेषण संबंधित हैं।

"The {adj} cat sat on the {adj} dog and the {adj} cat was happy." 

आपका नंबर 123 है, इसलिए अपने वाक्य

"The harmless cat sat on the evil dog and the colorful cat was happy." 

एक पार्सर आसानी से सजा ले जा सकते हैं है, यह अलग शब्दों में, इसके बाद के संस्करण की मेज पर विशेषण मिल जाए, और उन्हें संख्या के लिए वापस परिवर्तित ।

The -> ? 
harmless -> 1 
cat -> ? 
sat -> ? 
on -> ? 
the -> ? 
evil -> 2 
: 

अंत में आपके पास 123 फिर से है।

जैसे ही लोग जानते हैं कि वाक्य में छिपी हुई जानकारी है, एल्गोरिदम आसानी से टूटा हुआ है। यदि आप प्रति संख्या एकाधिक विशेषण परिभाषित करके भिन्नता जोड़ते हैं तो आप इसे तोड़ने में कठोर बना सकते हैं।

1. harmless 

के बजाय आप

1. harmless/stupid/blue/fashionable 

परिभाषित कर सकते हैं जब आप 1 सांकेतिक शब्दों में बदलना करने की जरूरत है, बेतरतीब ढंग से ऊपर से कोई भी शब्द लेने। चूंकि ये सभी नंबर 1 नंबर पर हैं, रिवर्स पार्सर परवाह नहीं होगा कि कौन से शब्दों को मुद्रित किया गया है, परिणाम हमेशा एक होगा। यह यादृच्छिकरण एल्गोरिदम इंजीनियर को रिवर्स करना कठिन बना देगा।

0

जॉन स्कीट का दृष्टिकोण मैथ्यू क्वान के "SNOW" दृष्टिकोण के समान ही है। उनमें से दोनों स्रोत पाठ में किसी भी शब्द को जोड़ने, हटाने, या बदलने के बिना पाठ में मनमानी जानकारी की छोटी मात्रा को छुपाते हैं। दोनों सामान्य रूप से-अप्रासंगिक, सामान्य रूप से अदृश्य सफेद जगह - शब्दों और पंक्तियों के सिरों के बीच अतिरिक्त स्थान और टैब वर्णों में गुप्त संदेश को एन्कोड करते हैं।

0

यहां एक प्रोटोटाइप एन्क्रिप्टेड डेटा को "प्राकृतिक" टेक्स्ट संदेश में परिवर्तित करता है।

http://herosys.net/w/project/text-steganography-hide-text-in-spam-sms

की तरह छोटे पाठ संदेश के लिए "विश्वविद्यालय के पूर्व दरवाजा, कल पर यू देखें 8 am" Convert स्रोत पाठ स्पैम की तरह लग रहा है।

"बेस्ट हाउस कभी! आपको इसे कभी याद नहीं करना चाहिए। 1000-3000 वर्ग फीट $ 15-80 प्रति वर्ग फीट कॉल 123-456-7890"।

एल्गोरिदम आप केवल व्याकरण चित्र बनाते हैं, और प्रत्येक शब्द के लिए उम्मीदवार तालिका बनाते हैं। बस BASE64 की तरह, लेकिन आपके पूर्वनिर्धारित संदर्भ के अनुसार अनुक्रमणिका तालिका बदल दी गई है।

+0

पहला लिंक 404 है। –

-1

मेरे पास अच्छी सुरक्षा के साथ दो योजनाएं हैं लेकिन काफी कम स्टीगबिट एम्बेडिंग दरों के व्यापार-बंद के साथ। उनमें से एक बेहद सरल है, लेकिन मनमाने ढंग से दिए गए पाठों की प्रति पंक्ति 1 बिट की एम्बेडिंग दर केवल तभी होती है, जबकि दूसरी, उपयोगकर्ता को सॉफ़्टवेयर के मार्गदर्शन में कवरटेक्स लिखने की आवश्यकता होती है, [0.5] की सीमा में एक एम्बेडिंग दर प्राप्त करती है , 1.0] प्रति शब्द। मेरा होम पेज देखें mok-kong-shen.de

+0

यह एक लिंक-केवल उत्तर की तरह दिखता है। कृपया पूर्ण जानकारी के लिए यहां प्रासंगिक जानकारी सारांशित करें और अतिरिक्त पढ़ने/संदर्भ/संदर्भ के लिए अंत में लिंक प्रदान करें। – Reti43

+0

@ रेटी 43: धन्यवाद। EMAILSTEGANO नामक एक योजना, टेक्स्ट (ईमेल इत्यादि) में शब्दों की संख्या को संशोधित करती है, जैसे लाइन मोड 2 में शब्दों की संख्या, यानी समानता, stegabit देता है। दूसरा, एक बड़ी अंग्रेजी शब्द सूची (ऐसे डाउनलोड करने योग्य हैं) को नियोजित करते हैं और लगभग दो प्राप्त करने के लिए सत्र-निर्भर गुप्त कुंजी के माध्यम से इसे घुमाते हैं। बराबर sublists। एक उपन्यास में शब्द 0 और दूसरे में इंगित करते हैं 1. शब्द उदा। "इन", "इन" इत्यादि इन सूचियों से बाहर रखा गया है। उपयोगकर्ता को अपनी पसंद के एक शब्द को बदलने के लिए कहा जाता है यदि यह शब्द वर्तमान स्टेगबिट द्वारा आवश्यक गलत उपन्यास में होता है। –

संबंधित मुद्दे