tm

    7गर्मी

    3उत्तर

    मैं tm::DocumentTermMatrix के दस्तावेज़ों के बीच जैककार्ड समानता की कुशलतापूर्वक गणना करने का एक तरीका चाहता हूं। मैं स्लैम पैकेज के माध्यम से कोसाइन समानता के लिए कुछ ऐसा कर सकता हूं जैसा कि this ans

    12गर्मी

    3उत्तर

    मैं TM पैकेज के साथ बहुत सारे विश्लेषण कर रहा हूं। मेरी सबसे बड़ी समस्याओं में से एक स्टेमिंग और स्टेमिंग-जैसे ट्रांसफॉर्मेशन से संबंधित है। मान लें कि मेरे पास कई लेखांकन संबंधी शब्द हैं (मुझे वर्तनी

    6गर्मी

    1उत्तर

    में बड़े डेटा के साथ टीएम के कॉर्पस फ़ंक्शन का उपयोग करें, मैं tm के साथ आर में बड़े डेटा पर टेक्स्ट खनन करने की कोशिश कर रहा हूं। (विंडोज, लिनक्स, सोलारिस मैं स्मृति मुद्दों में अक्सर (जैसे can not a

    12गर्मी

    3उत्तर

    में टर्म डॉक्यूमेंटमैटिक्स त्रुटियां मैं टर्म में डॉक्यूमेंट मैट्रिक्स बनाने का प्रयास कर आर में {tm} पैकेज के कई ऑनलाइन उदाहरणों के माध्यम से काम कर रहा हूं। एक कॉर्पस बनाना और साफ करना काफी सरल रहा

    6गर्मी

    2उत्तर

    अद्यतन वास्तव में विराम चिह्न निकालें कैसे: मुझे लगता है कि मैं इस समस्या को हल करने के लिए, बस एक कोड जोड़ने के लिए एक समाधान हो सकता है: dtms = removeSparseTerms(dtm,0.1) यह कोष में विरल चरित्र निका

    9गर्मी

    4उत्तर

    मैं एक ही समय में कई दस्तावेज़ों में होने वाले शब्दों को खोजने का प्रयास कर रहा हूं। हमें एक उदाहरण लें। doc1: "this is a document about milkyway" doc2: "milky way is huge" आप 2 दस्तावेजों ऊपर में

    8गर्मी

    2उत्तर

    मैं अपने द्वारा बनाए गए कॉर्पस से कुछ शब्दों को निकालने का प्रयास कर रहा हूं लेकिन ऐसा लगता है कि यह काम नहीं कर रहा है। मैं सबसे पहले सब कुछ के माध्यम से चलाता हूं और डेटाफ्रेम बनाता हूं जो मेरी आवृत

    5गर्मी

    4उत्तर

    मैं अन्य इसी तरह के सवाल है कि यहां पोस्ट किया गया है (जैसे this) को देखा है, लेकिन समस्या बनी रहती है में एक कोर्पस डाटा को फ्रेम रूपांतरित करने में असमर्थ। मैं टेक्स्ट का डेटा है, जो मैं स्टेम करने

    8गर्मी

    7उत्तर

    मैं आर और टीएम पैकेज में पूरी तरह से नया हूं, इसलिए कृपया मेरे बेवकूफ प्रश्न को क्षमा करें ;-) मैं आर टीएम पैकेज में सादा पाठ कॉर्पस का टेक्स्ट कैसे दिखा सकता हूं? मैं एक कोष में 323 सादा पाठ फ़ाइलों

    6गर्मी

    1उत्तर

    तोड़ता है मैं पिछले कुछ दिनों में इस पर अपना सिर तोड़ रहा हूं। मैंने सभी एसओ अभिलेखागारों की खोज की और सुझाए गए समाधानों का प्रयास किया लेकिन यह काम करने के लिए प्रतीत नहीं होता है। मेरे पास 2000 06,