मैं एक ऐसी साइट का निर्माण कर रहा हूं जो मशीन लर्निंग एल्गोरिदम के आउटपुट पर निर्भर करता है। साइट के उपयोगकर्ता के सामने वाले भाग के लिए आवश्यक सभी चीजें एल्गोरिदम (वस्तुओं के एक सेट के लिए कक्षा लेबल) का आउटपुट है, जिसे django
मॉडल से आसानी से संग्रहीत और पुनर्प्राप्त किया जा सकता है। एल्गोरिदम दिन में एक बार चलाया जा सकता है, और उपयोगकर्ता इनपुट पर भरोसा नहीं करता है।django प्रोजेक्ट के विकास और उत्पादन भागों को अलग करना
तो साइट का यह हिस्सा केवल django
और संबंधित पैकेज पर निर्भर करता है।
लेकिन विकास, ट्यूनिंग, और कलन विधि का मूल्यांकन का उपयोग करता है कई अन्य अजगर संकुल ऐसे scikit-learn
, pandas
, numpy
, matplotlib
, आदि के रूप यह भी वर्ग लेबल के कई अलग अलग सेट को सहेजने की आवश्यकता।
ये निर्भरता, जब heroku
करने की तैनाती कुछ समस्याओं का कारण है क्योंकि numpy
LAPACK/BLAS.
की आवश्यकता है यह भी लगता है जैसे कि यह तैनात अनुप्रयोग में संभव के रूप में कुछ निर्भरता के लिए अच्छा अभ्यास हो जाएगा।
मैं मशीन-लर्निंग भाग को उपयोगकर्ता के सामने वाले हिस्से से अलग कैसे कर सकता हूं, लेकिन, अभी भी उन्हें पर्याप्त रूप से एकीकृत किया गया है कि एल्गोरिदम के परिणाम आसानी से उपयोग किए जाते हैं?
मैंने दो अलग-अलग परियोजनाओं को बनाने के बारे में सोचा, और फिर उपयोगकर्ता के सामने वाले डेटाबेस को कुछ तरीकों से लिखना, लेकिन ऐसा लगता है कि इससे रखरखाव की समस्याएं हो सकती हैं (निर्भरताओं का प्रबंधन, डेटाबेस स्कीमा आदि में परिवर्तन)।
जहां तक मैं समझता हूं, यह समस्या उत्पादन और विकास के लिए विभिन्न सेटिंग्स या डेटाबेस का उपयोग करने से थोड़ा अलग है, क्योंकि यह निर्भरताओं के विभिन्न सेटों के प्रबंधन के बारे में अधिक है।
तुम्हें क्या लगता है डेटाबेस स्कीमा में निर्भरता और परिवर्तनों को प्रबंधित करना कोई समस्या है में से हर एक स्थापित करें? आपको वैसे भी उनके साथ सौदा करना है, है ना? –
इसके अलावा, मुझे यकीन नहीं है कि आपका शीर्षक सटीक है या नहीं। साइट और एल्गोरिदम कोड दोनों की तरह लगता है उत्पादन में होगा। –
एक परियोजना के साथ मैं सिर्फ एक वर्चुअल वातावरण में सभी निर्भरताएं रखता हूं। आंशिक रूप से ओवरलैपिंग निर्भरताओं के साथ दो परियोजनाएं होने से अधिक जटिल लगता है। जब तक एक पर्यावरण होने का कोई तरीका दूसरे का उप-समूह न हो। – ajerneck