2017-04-22 9 views
8

मैं वर्तमान में एक reCaptcha हल करने की कोशिश की प्रक्रिया में हूँ। प्राप्त सुझावों में से एक टोकन खेती नामक एक विधि थी।एक वेब स्क्रैपर का उपयोग कर अग्रिम में reCaptcha कैसे हल करें?

उदाहरण के लिए, किसी अन्य साइट से रीकैप्चा टोकन के लिए खेत करना संभव है, और 2 मिनट के भीतर, उस साइट पर खेती वाले टोकन में से एक को लागू करें जिसे मैं पीछे के साइट के कोड को बदलकर हल करने की कोशिश कर रहा हूं।

दुर्भाग्यवश, ऐसा करने के बारे में कोई और स्पष्टीकरण प्राप्त करने में सक्षम नहीं था, विशेष रूप से पीछे के साइट के कोड को बदलना।

यदि कोई भी प्रक्रिया को विस्तारित करने या अंतर्दृष्टि प्रदान करने में सक्षम है, तो वास्तव में विशेषज्ञता की सराहना करेगा।

+0

स्पष्टीकरण के लिए, क्या आप मनुष्यों को कैप्चा चुनौतियों का सामना कर रहे हैं और फिर वेबसाइट पर समाधान का उपयोग करने की कोशिश कर रहे हैं जिसे कैप्चा को स्वचालित आधार पर संरक्षित करने के लिए स्थापित किया गया था? – halfer

+0

कैप्चा सिस्टम –

+0

@ हेलफ़र में तोड़ने का प्रयास करने जैसा लगता है कि मुझे सूचित किया गया था कि आप किसी साइट पर रीकैप्चा हल कर सकते हैं और हल किए गए टोकन को पुनर्प्राप्त कर सकते हैं, और 2 मिनट के भीतर, यदि मैं रीकैप्चा के साथ किसी अन्य साइट पर जाना चाहता हूं, तो मैं कर सकता हूं मौजूदा reCaptcha को हल करने के लिए पहले हल किए गए reCaptcha टोकन का उपयोग करें। –

उत्तर

5

टोकन खेती/टोकन कटाई विस्तार से यहाँ वर्णित किया गया है: https://www.blackhat.com/docs/asia-16/materials/asia-16-Sivakorn-Im-Not-a-Human-Breaking-the-Google-reCAPTCHA-wp.pdf

"टोकन खेती" इस पत्र में चर्चा के लिए दृष्टिकोण निम्नलिखित तंत्र पर आधारित है:

  1. प्रत्येक उपयोगकर्ता है कि एक का दौरा रिकैप्चा के साथ साइट को recaptcha-token असाइन किया गया है।
  2. यह टोकन उपयोगकर्ता को कई साइट विज़िट पर पहचानने और उसे वैध (या अवैध) उपयोगकर्ता चिह्नित करने के लिए उपयोग किया जाता है।
  3. रिकैप्चा-टोकन, उपयोगकर्ता व्यवहार और ब्राउज़र कॉन्फ़िगरेशन की आयु जैसे विभिन्न कारकों के आधार पर प्रत्येक विज़िट पर उपयोगकर्ता या तो विभिन्न रिकैप्चा संस्करणों में से एक या यहां तक ​​कि कोई कैप्चा भी प्रस्तुत नहीं किया जाता है।

    मतलब, अगर एक लक्ष्य साइट के लिए नए और साफ टोकन की एक बड़ी संख्या बना सकते हैं और 9 दिनों के लिए उन्हें उम्र के कर सकते हैं (वो क्या है:

(https://github.com/neuroradiology/InsideReCaptcha अधिक जानकारी के उनके कोड यहां से निकाला जा सकता) आलेख पता चला), इन टोकन का उपयोग रिकैप्चा को देखने से पहले कुछ संरक्षित साइटों को पुनः प्राप्त करने के लिए किया जा सकता है।

मेरी समझ के लिए, इस तरह के एक ताजा टोकन को साइट पर कुकी के रूप में पास किया जाना है।

याद हालांकि मैंने कहीं पढ़ा था कि गूगल इस प्रस्तुति

इसके अलावा सबसे शायद वहाँ अन्य, समान दृष्टिकोण है कि "टोकन खेती" किया गया है कर रहे हैं के बाद कुछ दिनों के भीतर इस अंतर को बंद कर दिया।

जहां तक ​​मुझे पता है कि इन सभी दृष्टिकोणों ने रिकैप्चा सिस्टम में कमियों का शोषण किया है और इन छेड़छाड़ों को Google द्वारा वास्तव में तेज़ी से बंद कर दिया गया था - प्रायः पेपर या प्रेजेंटेशन सार्वजनिक होने के बावजूद जिम्मेदार लेखकों को आमतौर पर Google को अग्रिम में सूचित किया जाता है।

तो आपके लिए यह शायद अकादमिक मूल्य का सबसे अधिक है या सामान्य रूप से कैप्चा सिस्टम और टोकन आधारित सेवाओं की उचित सुरक्षा के बारे में सीखने के लिए है।

अद्यतन

कुछ recaptcha संरक्षित साइटों पर एक त्वरित जांच से पता चला कि मौजूदा प्रणाली अब कुकीज़ scrambles, लेकिन recaptcha-टोकन आंशिक रूप से अलग के साथ दो छिपे हुए इनपुट तत्व के रूप में recaptcha रूप में पाया जा सकता है मूल्य और आईडी = "रिकैप्चा-टोकन"।

एक स्वच्छ ब्राउज़र वाले ऐसे पृष्ठ पर जाने पर आपको एक नया रिकैप्चा टोकन मिलेगा जिसे आप बचा सकते हैं और आवश्यकता के बाद बाद में उसी फॉर्म में डालेंगे। कम से कम यह सिद्धांत है, यह बहुत संभावना है कि आपके ब्राउज़र में सभी कुकीज़ और कुछ दीर्घकालिक बने सामान आपको ऐसा करने से रोकेंगे।

+0

अंतर्दृष्टि की सराहना करें। मैं वास्तव में डॉक्टर पर गया था, लेकिन इसे लागू करने के बारे में जानकारी के बारे में ज्यादा जानकारी नहीं मिली। यह एक सीखने के उद्देश्य के लिए है और मानना ​​है कि अभी भी एक छेड़छाड़ है। तो इसे एक प्रयास देना चाहते हैं, लेकिन यह सुनिश्चित नहीं है कि साइट के कोड को पीछे से बदलकर सुझाव क्या है। क्या इसका मतलब HTML पृष्ठ स्रोत है? इसे आज़मा दिया लेकिन कुछ भी नहीं बदला। –

+0

मेरे उत्तर में जोड़ा गया विवरण, टोकन साइट पर कुकी के रूप में पास किया जाना है। हालांकि, आप इस प्रस्तुति में किसी भी परिणाम को पुन: पेश नहीं कर पाएंगे, क्योंकि Google ने पिछले साल इस छेड़छाड़ को बंद कर दिया था। – rrschmidt

+0

वास्तव में अंतर्दृष्टि की सराहना करते हैं! सीखने में रुचि रखते थे। स्पष्टीकरण के लिए, 'रिकैप्चा-टोकन' को वेब टोकन के रूप में सहेजा जा रहा है? और कुकी के रूप में ताजा टोकन पास करने की प्रक्रिया क्या थी? इसका मतलब यह है कि, उपयोगकर्ता एक reCaptcha हल करता है, और वह भंडारण में एक वेब टोकन स्टोर करेगा। फिर बस एक लक्ष्य पर जाकर, reCaptcha साइट, जो कुकी के रूप में टोकन पास कर रही है, क्योंकि टोकन अभी भी स्टोरेज में होगा? –

संबंधित मुद्दे