मैं काम करने की कोशिश कर रहा हूं कि सोलर खोज परिणामों के स्कोरिंग में सुधार कैसे किया जाए। मेरे आवेदन को सोलर परिणामों से स्कोर लेने की आवश्यकता है और परिणाम के परिणामस्वरूप कितने अच्छे हैं इस पर निर्
मैंने दो दस्तावेजों के टीएफ/आईडीएफ मूल्यों की गणना की। 1.txt
0.0
0.5
2.txt
0.0
0.5
दस्तावेजों की तरह हैं: 1.txt = > dog cat
2.txt = > cat elephant
मैं इन मूल्यों का उपयोग कैसे कोज्या समानता
में कोसाइन समानता की सरल कार्यान्वयन मैं एक DB में संग्रहीत दस्तावेज़ों की तुलना और 0 और 1. विधि मैं उपयोग करने के लिए है की जरूरत है जो समानता स्कोर के साथ आने की जरूरत है बहुत आसान होना टी-आईडीएफ और
आपके द्वारा पहले दी गई सभी सहायता के लिए धन्यवाद। मुझे अभी एक छोटा सा प्रश्न मिला है जो मुझे भ्रमित करता है। टीएफ-आईडीएफ और कोसाइन समानता। मैं दोनों को और फिर कोसीन समानता के तहत विकी पर पढ़ रहा था, म
I'm trying to use TF-IDF। मैं कुछ दस्तावेजों के लिए tf_idf गणना की है, लेकिन अब जब मैं इन दस्तावेजों मैं एक ट्रैस बैक कहावत मिल दोनों के बीच कोसाइन समानता की गणना करने के लिए प्रयास करें: #len(u)==201