में एक विरल मैट्रिक्स से एक घने मैट्रिक्स जनरेट कर रहा है मैं एक SQLite डेटाबेस स्कीमा निम्न प्रकार के शामिल है। numpy अजगर
तरह(doc1 , term1 ,12)
(doc1, term 22, 2)
.
.
(docn,term1 , 10)
इस मैट्रिक्स विरल मैट्रिक्स के रूप में माना जा सकता है के रूप में प्रत्येक दस्तावेज बहुत कुछ शर्तों है कि एक गैर शून्य मान होगा शामिल हैं।
मैं इस विरल मैट्रिक्स से एक घने मैट्रिक्स numpy का उपयोग कर के रूप में मैं कोज्या समानता का उपयोग कर दस्तावेजों के बीच समानता की गणना करने के लिए है कैसे बना होगा।
इस घने मैट्रिक्स एक मेज है कि पहले स्तंभ के रूप में डाक आईडी है और सभी नियमों पहले row.and शेष कोशिकाओं की गिनती में शामिल होंगे के रूप में सूचीबद्ध किया जाएगा की तरह दिखाई देगा।