CAPTCHAs इतना कठिन क्यों हो गया है

यह प्रदर्शित करना कि आप रोबोट नहीं हैं, कठिन और कठिन होता जा रहा है

का हिस्सावास्तविक दुनिया एआई मुद्दा

पिछले साल किसी बिंदु पर, Google के लगातार अनुरोध यह साबित करने के लिए कि मैं इंसान हूं, तेजी से आक्रामक महसूस करने लगा। अधिक से अधिक, सरल, थोड़ा बहुत प्यारा बटन कह रहा है कि मैं रोबोट नहीं हूं, इसके बाद इसे साबित करने की मांग की गई - एक छवि ग्रिड में सभी ट्रैफिक लाइट, क्रॉसवॉक और स्टोरफ्रंट का चयन करके। जल्द ही ट्रैफिक लाइटें दूर के पर्णसमूह में दब गईं, क्रॉसवॉक विकृत हो गए और आधे कोने के आसपास, स्टोरफ्रंट साइनेज धुंधली और कोरियाई में। अग्नि हाइड्रेंट की पहचान करने और उस पर संघर्ष करने के लिए कहा जाने के बारे में कुछ विशिष्ट रूप से विवादित है।



इन परीक्षणों को कैप्चा कहा जाता है, जो कंप्यूटर और मनुष्यों को अलग बताने के लिए पूरी तरह से स्वचालित सार्वजनिक ट्यूरिंग परीक्षण का एक संक्षिप्त नाम है, और वे पहले भी इस तरह के अचूकता पठार तक पहुँच चुके हैं। 2000 के दशक की शुरुआत में, टेक्स्ट की सरल छवियां अधिकांश स्पैमबॉट्स को स्टंप करने के लिए पर्याप्त थीं। लेकिन एक दशक बाद, जब Google ने कार्नेगी मेलॉन के शोधकर्ताओं से कार्यक्रम खरीदा था और Google पुस्तकों को डिजिटाइज़ करने के लिए इसका इस्तेमाल कर रहा था, ऑप्टिकल कैरेक्टर रिकग्निशन प्रोग्राम्स में सुधार के लिए आगे रहने के लिए ग्रंथों को तेजी से विकृत और अस्पष्ट करना पड़ा - प्रोग्राम, जो एक चौराहे के रास्ते में, CAPTCHAs को हल करने वाले वे सभी मनुष्य सुधार करने में मदद कर रहे थे।



वे सभी awnings जो स्टोरफ्रंट हो सकते हैं या नहीं भी हो सकते हैं? वे मशीनों के साथ मानवता की हथियारों की दौड़ में अंतिम खेल हैं।

क्योंकि CAPTCHA AI को प्रशिक्षित करने के लिए एक ऐसा सुंदर उपकरण है, कोई भी दिया गया परीक्षण केवल अस्थायी हो सकता है, जिसे इसके आविष्कारकों ने शुरू में स्वीकार किया था। उन सभी शोधकर्ताओं, धोखेबाजों, और सामान्य मनुष्यों के साथ एआई क्या कर सकता है, की दहलीज पर अरबों पहेलियों को हल कर रहा था, किसी समय मशीनें हमारे पास से गुजरने वाली थीं। में2014, Google ने सबसे विकृत टेक्स्ट कैप्चा को हल करने में मनुष्यों के खिलाफ अपने मशीन लर्निंग एल्गोरिदम में से एक को खड़ा किया: कंप्यूटर ने 99.8 प्रतिशत सही परीक्षण किया, जबकि मनुष्यों ने परीक्षण कियाकेवल 33 प्रतिशत . मिला.

Google फिर . में चला गयानो कैप्चा रीकैप्चा, जो उपयोगकर्ता डेटा और व्यवहार का निरीक्षण करता है ताकि कुछ मनुष्यों को मैं रोबोट नहीं हूं बटन के एक क्लिक से गुजरने देता हूं, और दूसरों को छवि लेबलिंग के साथ प्रस्तुत करता है जिसे हम आज देखते हैं। लेकिन मशीनें एक बार फिर रफ्तार पकड़ रही हैं। वे सभी awnings जो स्टोरफ्रंट हो सकते हैं या नहीं भी हो सकते हैं? वे मशीनों के साथ मानवता की हथियारों की दौड़ में अंतिम खेल हैं।



शिकागो में इलिनोइस विश्वविद्यालय में कंप्यूटर विज्ञान के प्रोफेसर जेसन पोलाकिस, कैप्चा कठिनाई में हालिया वृद्धि के लिए व्यक्तिगत श्रेय लेते हैं। 2016 में, उन्होंने एक पेपर प्रकाशित किया जिसमें उन्होंने Google की अपनी रिवर्स इमेज सर्च सहित ऑफ-द-शेल्फ इमेज रिकग्निशन टूल्स का इस्तेमाल किया, ताकि Google की इमेज कैप्चा को 70 प्रतिशत सटीकता के साथ हल किया जा सके। अन्य शोधकर्ताओं ने Google के स्वयं के ऑडियो पहचान कार्यक्रमों का उपयोग करके Google की ऑडियो कैप्चा चुनौतियों को तोड़ा है।

पोलाकिस का कहना है कि मशीन लर्निंग अब बुनियादी टेक्स्ट, इमेज और वॉयस रिकग्निशन टास्क में इंसानों जितना ही अच्छा है। वास्तव में, एल्गोरिदम शायद इसमें बेहतर हैं: हम एक ऐसे बिंदु पर हैं जहां सॉफ़्टवेयर के लिए इसे कठिन बनाना कई लोगों के लिए बहुत कठिन बना देता है। हमें कुछ विकल्प चाहिए, लेकिन अभी तक कोई ठोस योजना नहीं है।

कलह के लिए यादें
इन परीक्षणों में से कई के साथ समस्या यह नहीं है कि बॉट बहुत चालाक हैं - यह है कि मनुष्य उन्हें चूसते हैं

कैप्चा पर साहित्य झूठी शुरुआत और पाठ या छवि पहचान के अलावा कुछ और खोजने के अजीब प्रयासों से भरा हुआ है, जिसमें मनुष्य सार्वभौमिक रूप से अच्छे हैं और मशीनों के साथ संघर्ष करते हैं।शोधकर्ताओंने उपयोगकर्ताओं से चेहरे के भाव, लिंग और जातीयता के आधार पर लोगों की छवियों को वर्गीकृत करने के लिए कहा है। (आप कल्पना कर सकते हैं कि यह कितना अच्छा रहा।) ट्रिविया कैप्चा और कैप्चा के आधार पर प्रस्ताव आए हैंबाल कविताएंउस क्षेत्र में आम है जहां एक उपयोगकर्ता कथित तौर पर बड़ा हुआ है। इस तरह के सांस्कृतिक कैप्चा का लक्ष्य न केवल बॉट्स है, बल्कि विदेशों में काम करने वाले कैप्चा फार्मों में काम करने वाले मनुष्यों के लिए एक प्रतिशत के अंश के लिए पहेली को हल करना है। लोगों ने उपयोगकर्ताओं को सूअरों की पहचान करने, कहने के लिए कहने, लेकिन सूअरों को कार्टून बनाने और उन्हें धूप का चश्मा देने के लिए कहकर छवि पहचान को रोकने की कोशिश की है। शोधकर्ताओं ने उपयोगकर्ताओं से वस्तुओं की पहचान करने के लिए कहा हैजादू की आँख जैसा धब्बा. एक दिलचस्प बदलाव में, 2010 में शोधकर्ताओं ने इंडेक्स के लिए कैप्चा का उपयोग करने का प्रस्ताव रखाप्राचीन पेट्रोग्लिफ्स, गुफा की दीवारों पर रेंगने वाले बारहसिंगों के हावभाव रेखाचित्रों को समझने में कंप्यूटर बहुत अच्छे नहीं हैं।



हाल ही में विकसित करने के प्रयास किए गए हैंखेल की तरह कैप्चा, परीक्षण जिसमें उपयोगकर्ताओं को वस्तुओं को कुछ कोणों पर घुमाने या पहेली के टुकड़ों को स्थिति में ले जाने की आवश्यकता होती है, निर्देश पाठ में नहीं बल्कि प्रतीकों में या गेम बोर्ड के संदर्भ में निहित होते हैं। आशा है कि मनुष्य पहेली के तर्क को समझेंगे लेकिन कंप्यूटर, स्पष्ट निर्देशों की कमी, स्टम्प्ड हो जाएंगे। अन्य शोधकर्ताओं ने इस तथ्य का फायदा उठाने की कोशिश की है कि इंसानों के शरीर हैं, डिवाइस कैमरों या मानवता के इंटरैक्टिव सबूत के लिए संवर्धित वास्तविकता का उपयोग करते हैं।

इन परीक्षणों में से कई के साथ समस्या यह नहीं है कि बॉट बहुत चालाक हैं - यह है कि मनुष्य उन्हें चूसते हैं। और ऐसा नहीं है कि मनुष्य गूंगे हैं; यह है कि मनुष्य भाषा, संस्कृति और अनुभव में बेतहाशा विविध हैं। एक बार जब आप परीक्षण करने के लिए उन सभी चीजों से छुटकारा पा लेते हैं किकोई भीमानव बिना किसी पूर्व प्रशिक्षण या अधिक विचार के पास हो सकता है, आप छवि प्रसंस्करण जैसे क्रूर कार्यों के साथ रह गए हैं, ठीक उसी तरह से एक दर्जी एआई अच्छा होने वाला है।

इंसान होना क्या है?

पोलाकिस कहते हैं, परीक्षण मानवीय क्षमताओं से सीमित हैं। यह केवल हमारी शारीरिक क्षमता नहीं है, आपको कुछ ऐसा चाहिए जो सांस्कृतिक, क्रॉस लैंग्वेज को पार कर सके। आपको किसी प्रकार की चुनौती की आवश्यकता है जो ग्रीस के किसी व्यक्ति, शिकागो के किसी व्यक्ति, दक्षिण अफ्रीका, ईरान और ऑस्ट्रेलिया के किसी व्यक्ति के साथ एक ही समय में काम करे। और इसे सांस्कृतिक पेचीदगियों और मतभेदों से स्वतंत्र होना होगा। आपको कुछ ऐसा चाहिए जो एक औसत मानव के लिए आसान हो, यह लोगों के एक विशिष्ट उपसमूह के लिए बाध्य नहीं होना चाहिए, और यह एक ही समय में कंप्यूटर के लिए कठिन होना चाहिए। आप वास्तव में जो कर सकते हैं उसमें यह बहुत सीमित है। और यह कुछ ऐसा होना चाहिए जो मनुष्य तेजी से कर सके, और यह बहुत कष्टप्रद नहीं है।

चुड़ैल पुस्तक श्रृंखला

यह पता लगाना कि उन धुंधली छवि क्विज़ को कैसे ठीक किया जाए, आपको जल्दी से दार्शनिक क्षेत्र में ले जाता है: सार्वभौमिक मानव गुणवत्ता क्या है जिसे एक मशीन के लिए प्रदर्शित किया जा सकता है, लेकिन कोई मशीन नकल नहीं कर सकती है? इंसान होना क्या है?

लेकिन हो सकता है कि हमारी मानवता को इस बात से नहीं मापा जाता है कि हम किसी कार्य के साथ कैसा प्रदर्शन करते हैं, बल्कि हम दुनिया में कैसे आगे बढ़ते हैं - या इस मामले में, इंटरनेट के माध्यम से। गेम कैप्चा, वीडियो कैप्चा, जो भी कैप्चा परीक्षण आप तैयार करते हैं, वह अंततः टूट जाएगा, शुमन घोषमजुमदार कहते हैं, जिन्होंने पहले बॉट-डिटेक्शन कंपनी शेप सिक्योरिटी के मुख्य प्रौद्योगिकी अधिकारी बनने से पहले क्लिक धोखाधड़ी का मुकाबला करने के लिए Google पर काम किया था। परीक्षणों के बजाय, वह निरंतर प्रमाणीकरण नामक किसी चीज़ का समर्थन करता है, अनिवार्य रूप से उपयोगकर्ता के व्यवहार को देखता है और स्वचालन के संकेतों की तलाश करता है। एक वास्तविक इंसान का अपने स्वयं के मोटर कार्यों पर बहुत अच्छा नियंत्रण नहीं होता है, और इसलिए वे माउस को एक ही तरह से एक से अधिक बार एक से अधिक बार नहीं ले जा सकते हैं, भले ही वे वास्तव में कठिन प्रयास करें, घोसमजुमदार कहते हैं। जबकि एक बॉट एक माउस को हिलाए बिना, या एक माउस को बहुत सटीक रूप से ले जाकर एक पृष्ठ के साथ बातचीत करेगा, मानव क्रियाओं में एन्ट्रापी होती है जिसे धोखा देना मुश्किल होता है, घोषमजुमदार कहते हैं।

Google की अपनी CAPTCHA टीम इसी तर्ज पर सोच रही है। नवीनतम संस्करण,रीकैप्चा v3, पिछले साल के अंत में घोषित किया गया था, ट्रैफ़िक को स्कोर करने के लिए अनुकूली जोखिम विश्लेषण का उपयोग करता है कि यह कितना संदिग्ध लगता है; वेबसाइट के मालिक तब स्केची उपयोगकर्ताओं को एक चुनौती के साथ पेश करना चुन सकते हैं, जैसे पासवर्ड अनुरोध या दो-कारक प्रमाणीकरण। कैप्चा टीम के उत्पाद प्रबंधक साइ खोरमी के अनुसार, Google यह नहीं बताएगा कि उस स्कोर में कौन से कारक जाते हैं, इसके अलावा Google देखता है कि साइट पर अच्छा ट्रैफ़िक कैसा दिखता है, और इसका उपयोग खराब ट्रैफ़िक का पता लगाने के लिए करता है। सुरक्षा शोधकर्ताओं का कहना है कि यह संभवतः कुकीज़, ब्राउज़र विशेषताओं, ट्रैफ़िक पैटर्न और अन्य कारकों का मिश्रण है। बॉट डिटेक्शन के नए मॉडल की एक खामी यह है कि यह निगरानी को कम करते हुए वेब को नेविगेट करना एक कष्टप्रद अनुभव बना सकता है, क्योंकि वीपीएन और एंटी-ट्रैकिंग एक्सटेंशन जैसी चीजें आपको संदिग्ध और चुनौतीपूर्ण के रूप में चिह्नित कर सकती हैं।

मुझे लगता है कि लोग महसूस कर रहे हैं कि औसत मानव उपयोगकर्ता ... या गूंगा इंसानों को अनुकरण करने के लिए एक आवेदन है।

Google की CAPTCHA टीम के इंजीनियरिंग प्रमुख आरोन मालेनफैंट का कहना है कि ट्यूरिंग परीक्षणों से दूर जाने का मतलब उस प्रतिस्पर्धा को दूर करना है जो मनुष्य हारता रहता है। जैसे-जैसे लोग मशीन लर्निंग में अधिक से अधिक निवेश करते हैं, उन प्रकार की चुनौतियों को मनुष्यों के लिए कठिन और कठिन होना पड़ेगा, और इसलिए विशेष रूप से हमने उस वक्र से आगे निकलने के लिए CAPTCHA V3 लॉन्च किया। मालेनफैंट का कहना है कि अब से पांच से दस साल बाद, कैप्चा चुनौतियां बिल्कुल भी व्यवहार्य नहीं होंगी। इसके बजाय, अधिकांश वेब की पृष्ठभूमि में एक स्थिर, गुप्त ट्यूरिंग परीक्षण चल रहा होगा।

अपनी किताब मेंसबसे मानव मानव, ब्रायन क्रिश्चियन ट्यूरिंग टेस्ट प्रतियोगिता में मानव पन्नी के रूप में प्रवेश करते हैं और पाते हैं कि बातचीत में अपनी मानवता को साबित करना वास्तव में काफी कठिन है। दूसरी ओर, बॉट निर्माताओं ने सबसे वाक्पटु या बुद्धिमान संवादी होने के कारण इसे पारित करना आसान नहीं पाया है, लेकिन गैर-अनुक्रमिक चुटकुलों के साथ प्रश्नों को चकमा देकर, टाइपो बनाकर, या बॉट के मामले में जिसने एक जीता है2014 में ट्यूरिंग प्रतियोगिता, एक 13 वर्षीय यूक्रेनी लड़का होने का दावा करता है जिसे अंग्रेजी की खराब समझ है। आखिर गलती करना तो इंसान है। यह संभव है कि एक समान भविष्य कैप्चा के लिए स्टोर में है, जो दुनिया में सबसे व्यापक रूप से इस्तेमाल किया जाने वाला ट्यूरिंग टेस्ट है - एक नई हथियारों की दौड़ में बॉट्स बनाने के लिए नहीं जो छवियों को लेबल करने और टेक्स्ट को पार्स करने में मनुष्यों से आगे निकल जाते हैं, लेकिन जो गलतियां करते हैं, मिस बटन, विचलित हो जाते हैं , और टैब स्विच करें। मुझे लगता है कि लोग महसूस कर रहे हैं कि औसत मानव उपयोगकर्ता ... या गूंगे इंसानों का अनुकरण करने के लिए एक आवेदन है, घोषमजुमदार कहते हैं।

कैप्चा परीक्षण इस दुनिया में भी जारी रह सकते हैं। वीरांगनाएक पेटेंट प्राप्त किया2017 में ऑप्टिकल इल्यूजन और लॉजिक पज़ल्स से जुड़ी एक योजना के लिए मनुष्यों को समझने में बड़ी कठिनाई होती है। विफलता के माध्यम से ट्यूरिंग टेस्ट कहा जाता है, उत्तर को गलत प्राप्त करने का एकमात्र तरीका है।