के लिए एकाधिक अनुक्रम संरेखण की गणना कैसे करें मैं एक प्रोग्राम लिख रहा हूं जिसमें स्ट्रिंग्स के सेट के multiple sequence alignment की गणना करना है। मैं पाइथन में ऐसा करने की सोच रहा था, लेकिन अगर यह अधिक व्यावहारिक है तो मैं सॉफ्टवेयर या किसी अन्य भाषा का बाहरी टुकड़ा उपयोग कर सकता हूं। डेटा विशेष रूप से बड़ा नहीं है, मेरे पास मजबूत प्रदर्शन आवश्यकताओं नहीं हैं और मैं अनुमानों को सहन कर सकता हूं (यानी मुझे केवल पर्याप्त संरेखण खोजने की आवश्यकता है)। एकमात्र समस्या यह है कि तार नियमित तार होते हैं (यानी यूटीएफ -8 स्ट्रिंग्स संभावित रूप से न्यूलाइन के साथ जिन्हें नियमित चरित्र के रूप में माना जाना चाहिए); वे डीएनए अनुक्रम या प्रोटीन अनुक्रम नहीं हैं।टेक्स्ट स्ट्रिंग्स
मैं विशिष्ट जटिल फाइल प्रारूपों के साथ जैव सूचना विज्ञान में सामान्य मामलों के लिए कई टूल और जानकारी पा सकता हूं और मुझे कई सुविधाओं की आवश्यकता नहीं है, लेकिन यह सरल, सरलता के लिए सॉफ्टवेयर, पुस्तकालय या उदाहरण कोड खोजने के लिए अप्रत्याशित रूप से कठिन है तारों का मामला मैं शायद इस समस्या के लिए कई एल्गोरिदम में से किसी एक को फिर से कार्यान्वित कर सकता हूं या मेरी स्ट्रिंग को डीएनए के रूप में एन्कोड कर सकता हूं, लेकिन एक बेहतर तरीका होना चाहिए। क्या आप किसी भी समाधान के बारे में जानते हैं?
धन्यवाद!
गणना करके आपका क्या मतलब है? क्या आप एक सर्वोत्तम संरेखण पाने की कोशिश कर रहे हैं? – DTing
हां, या एक उचित रूप से अच्छा संरेखण (अनुमान ठीक है)। – a3nm
क्या आप भी एक बेहतर diff उपकरण की तलाश में हैं? –