मेरे पास अलग-अलग प्रदाताओं हैं जो मुझे विभिन्न शहरों के साथ एक एक्सेल पास करते हैं, प्रत्येक शहर में वे अपने परिचालन के लिए कुछ विशेष कोड और मेरे व्यवसाय के लिए अधिक उपयोगी डेटा का उपयोग करते हैं।विभिन्न स्रोतों से शहरों की पहचान और संबंधित
- मेरी डेटाबेस में मैं अपने ही शहर हैं, 9000 के रिकॉर्ड के आसपास:
समस्या यह है कि मैं इन सभी शहरों के साथ एक गड़बड़ है।
- प्रदाता एक मुझे 6000
- आसपास प्रदाता बी मुझे एक और 5000
- प्रदाता सी देता है प्राप्त करने के लिए अपने एक्सेल या वेब सेवा देता है ... आदि
मेरी प्रदाताओं द्वारा दिए गए शहरों में से कुछ हैं पहले से ही मेरे डेटाबेस में और मुझे केवल आवश्यक आवश्यक डेटा अपडेट करना होगा।
अन्यथा, मुझे अपने डेटाबेस में वह नया शहर डालना होगा।
और यह हर बार एक प्रदाता मुझे इन शहरों का अद्यतन देता है।
ठीक है, मुख्य समस्या यह है कि मैं उन्हें से अलग ढंग से एक शहर कहते हैं, और वे एक दूसरे से अलग ढंग से ... कैसे जानना चाहते हैं कि मैं पहले से ही है कि शहर है या मैं के बाद से उपयोग हम एक नया एक बनाने के लिए है अलग-अलग नाम?
जिस तरह से मैं इसे देखता हूं, मैं केवल इसे मैन्युअल रूप से प्राप्त कर सकता हूं। खानों के साथ अपने शहरों की तुलना।
बेशक, यह बहुत ज्यादा काम है, इसलिए मैं अपने खुद के स्क्रिप्ट बनाया है, और डेटाबेस के लिए levehnstein समारोह को लागू करने, मैं अपने आप को और अधिक संपाती लोगों को देखते हैं और एक क्लिक से उनका चयन कर सकते हैं। स्क्रिप्ट बाकी करता है (उस शहर के लिए अपने विशेष ऑपरेशन कोड को मेरे डेटाबेस में संग्रहीत मेरे संबंधित शहर में अपडेट करता है)।
इसके साथ भी, मुझे अभी भी लगता है कि मुझे कुछ याद आ रहा है। यदि उन शहरों के लिए एक यूनिकोड था तो यह बहुत आसान और स्वचालित होगा, लेकिन मेरे पास कोई कोड नहीं है जो इन तालिकाओं को मेरे टेबल पहचानकर्ता से अधिक पहचानता है। मेरे प्रदाताओं के लिए वही है, कुछ उपयोगों के बावजूद मुझे उन शहरों के बीच डाक कोड प्रदान करने के लिए, लेकिन सभी नहीं।
क्या इसके लिए मेरा कोई बेहतर समाधान है? कोई सार्वभौमिक कोड जिसे आप आमतौर पर उपयोग करते हैं या कोई अन्य अपहरण करते हैं?
संपादित करें: ठीक है, प्रत्येक शहर एक देश से संबंधित है। बेशक, मैं उस पर विचार कर रहा हूँ।
मेरी शहर तालिका में मेरे पास प्रत्येक गंतव्य के लिए एक आईडी है, और फिर प्रत्येक प्रदाता के ऑपरेशन कोड के लिए एक कॉलम (मुझे पता है, यह बेहतर रिश्ते के साथ बेहतर प्रतिनिधित्व किया जा सकता है), साथ ही देश कोड, ज़िप, यूआरएल एसईओ ...
मैग्नसएल द्वारा उल्लिखित समाधान का सम्मान करते हुए, समानार्थी तालिका बनाने के लिए, मुझे समानार्थी को संग्रहीत करने की आवश्यकता क्यों होगी? लिवेनस्टीन और मानव संपर्क के साथ आपके द्वारा वर्णित लिपि के बारे में, यह वही है जो मैं वर्तमान में कर रहा हूं:
प्रत्येक प्रदाता और मेरी गंतव्यों तालिका द्वारा प्रदान किए गए प्रत्येक रिकॉर्ड के साथ। एक प्रदाता शहर के रिकॉर्ड को देखते हुए, मैं अपनी मेज से अधिक संयोग दिखा रहा हूं।
लेकिन इससे पहले, मैं उन सभी को स्वचालित रूप से लिंक करता हूं जो ज़िप कोड और देश में संयोगी हैं।
यह मेरे प्रदाताओं को प्रत्येक शहर के लिए विशेष ऑपरेशन कोड अपडेट करने के लिए बहुत सारे काम है। मैं इस बारे में उत्सुक हूं कि लोग इस समस्या से कैसे निपटते हैं, मुझे यकीन है कि बहुत से डेवलपर्स को किसी बिंदु पर इसका सामना करना पड़ता है।
कितने प्रदाता हैं और क्या उनके पास हमेशा शहर के लिए समान नाम है या कोई नियम नहीं है? उदाहरण के लिए, "शिकागो" के लिए एक प्रदाता हमेशा "CHICAGO" देता है या यह "शिकागो" या कुछ भी समान हो सकता है? मैं सोच रहा हूं कि आप शायद कुछ आंतरिक "एआई" बना सकते हैं जो प्रत्येक प्रदाता के लिए-> से जानकारी मैप करके समय में सीखेंगे। – Vladan
क्या आपके सभी शहर एक ही देश से हैं? क्या वैकल्पिक वर्तनी, गलत वर्तनी या विभिन्न भाषाओं के कारण शहर के नामों में मतभेद हैं? –
@ फ्रैंकिसइटन डोर्टोर्ट नहीं, पूरी दुनिया में। हां, अलग-अलग वर्तनी, गलत वर्तनी और यहां तक कि भाषाएं भी। – vivoconunxino