मैं एक मानक ध्वन्यात्मक एल्गोरिथ्म का लाभ लगता है कि एक अच्छा विचार होगा। मुझे लगता है कि साउंडएक्स थोड़ा सीमित हो सकता है, लेकिन double metaphone शायद एक अच्छा विकल्प होगा।
प्रश्न में शब्दों के मेटाफोन का प्रतिनिधित्व प्राप्त करें, पहले अक्षर हटाएं, और जांचें कि दो शब्दों के छोटे हिस्से का शेष भाग लंबे समय के अंत से मेल खाता है या नहीं। डबल मेटाफोन के साथ, यह बहुत समान है, लेकिन चार तुलना करें, प्राथमिक से प्राथमिक, माध्यमिक से प्राथमिक, प्राथमिक से माध्यमिक और द्वितीयक माध्यमिक माध्यमिक।
मुझे लगता है कि यह एक अच्छा प्रारंभिक बिंदु होगा।
इस और कई अन्य ध्वन्यात्मक एल्गोरिदम पर एक नोट: यह सटीक ध्वन्यात्मक परिभाषा प्रदान करने के लिए डिज़ाइन नहीं किया गया है। विविध भौगोलिक उच्चारण, सामान्य गलतप्रचार और वैकल्पिक उच्चारण एक कठोर और तेज़ एकल सही उच्चारण शब्द को पूरी तरह से प्राप्त करने के लिए असंभव बनाते हैं। उपन्यास वर्तनी और अक्षर के उपयोग से एल्गोरिदमिक रूप से एक करीबी उच्चारण प्राप्त करना मुश्किल हो जाता है (कुछ हॉर्स डी 'ओवेरेस की देखभाल?)। इसके अलावा, इस तरह के कई एल्गोरिदम का एक बड़ा लक्ष्य समान ध्वनि या ग़लत शब्दों या नामों को एक-दूसरे से मेल करना है, इसलिए परिणाम आमतौर पर थोड़ा अपरिहार्य होना चाहिए (यह संभवतः इस उद्देश्य के लिए भी एक अच्छी बात है)।
शुभकामनाएं, अंतहीन रूप से कठिन? – EricG
एक कविता की परिभाषा क्या है? –
@AlexLynch http://en.wikipedia.org/wiki/Rhyme, मुझे नहीं पता कि आपकी भाषा उन्हें परिभाषित करती है लेकिन मेरे मूल (पोलिश) में हम rhymes को भी वर्गीकृत करते हैं। ;-) –