Friday, 6 September 2019

यह आश्चर्यजनक है कि एआई के बारे में सोचना आसान है एक टैक्सी एक वैक्यूम क्लीनर है

टेक्नोलॉजिस्ट मशीन सीखने को एक पेडस्टल पर रखना पसंद करते हैं, पूरक और यहां तक ​​कि मानव श्रम को पार करने की अपनी क्षमता को बढ़ाते हैं, लेकिन ये प्रणालियां परिपूर्ण नहीं हैं। वास्तव में, वे अभी भी स्वयं के स्वामित्व के लिए काफी कमजोर हैं। जनवरी से एक शोध पत्र यह बताता है कि एक छवि मान्यता तंत्रिका नेटवर्क को धोखा देना कितना आसान है।
ऑबर्न यूनिवर्सिटी में कंप्यूटर साइंस के सहायक प्रोफेसर और अध्ययन पर शोध करने वाले एएन न्गुयेन ने कहा, "यदि आप एक फायरट्रैक से शुरू करते हैं, तो आपको इसे थोड़ा-सा घुमाने की जरूरत है और यह लगभग निश्चित आत्मविश्वास के साथ एक स्कूल बस बन जाएगा।" गुरुवार को एक फोन कॉल में गिज़मोडो।
स्ट्राइक विद ए पोज़: न्यूरल नेटवर्क्स आर स्टिल्ड फ्रूव्ड फ्रॉम अजीब पोज़ीज़, " शीर्षक वाले पेपर ने इमेजनेट से 3 डी ऑब्जेक्ट्स के डेटासेट एकत्र किए, उन्हें घुमाया और फिर एक गहरे तंत्रिका नेटवर्क की छवि वर्गीकरण का परीक्षण किया। जब वस्तुओं की स्थिति को थोड़ा बदल दिया गया था, तो तंत्रिका जाल ने उन्हें 97 प्रतिशत समय में मिसकॉल किया।
शोधकर्ताओं ने कागज में इंगित किया है कि इस आश्चर्यजनक विफलता दर के उदाहरण के रूप में स्वयं-ड्राइविंग कारों का उपयोग करके ऑफ़लाइन परिणाम हो सकते हैं। वे स्वीकार करते हैं कि वास्तविक दुनिया में, "सड़कों पर वस्तुएं अनंत प्रकार की पोज़ में दिखाई दे सकती हैं" और यह कि सेल्फ-ड्राइविंग कारों को उन वस्तुओं की सही पहचान करने में सक्षम होने की आवश्यकता होती है, जो स्थिति को शान्ति से संभालने के लिए अपने रास्ते में प्रकट हो सकते हैं। क्षति को कम करें। ”दूसरे शब्दों में, यदि सेल्फ-ड्राइविंग कार का इमेज रिकग्निशन सॉफ्टवेयर अपने रास्ते में फायरट्रेक की पहचान नहीं कर सकता है क्योंकि यह एक तरह से तैनात है जो इमेज को उसके डेटासेट से मेल नहीं खाता है, इसके संभावित घातक परिणाम हैं दोनों पक्षों के लिए।
गिज़मोडो ने गुयेन के साथ अपने सबसे हालिया पेपर के साथ-साथ छवि मान्यता एआई से जुड़े अन्य काम और मूर्ख बनने की उनकी क्षमता के बारे में बात की। 
यह साक्षात्कार लंबाई और स्पष्टता के लिए संपादित किया गया है।
गिज़मोडो: सेल्फ-ड्राइविंग कार उदाहरण वास्तव में कुछ और भयावह हानिकारक परिणामों को समझने का एक दिलचस्प तरीका है। क्या एक अधिक सांसारिक उदाहरण है कि लोगों को इस तरह की मान्यता का एहसास नहीं हो सकता है, जहां अगर यह एक वस्तु को पहचान नहीं सकता है तो यह प्रभावी ढंग से काम करने वाला नहीं है?
गुयेन: आप गोदाम में रोबोट या मोबाइल होम रोबोट की कल्पना कर सकते हैं जो चारों ओर देखते हैं और सामान लेने की कोशिश करते हैं या आपके लिए कुंजी ढूंढते हैं। और आसपास पड़ी ये वस्तुएं किसी भी अभिविन्यास में किसी भी मुद्रा में हो सकती हैं। वे कहीं भी हो सकते हैं। आप उनसे उम्मीद नहीं करते हैं कि वे कैनोनिकल पोज़ में होंगे और इसलिए उन्हें प्रतिकूल पोज़ देकर मूर्ख बनाया जाएगा।
यह एक है, लेकिन आप हवाई अड्डों और सुरक्षा में टीएसए के बारे में भी सोच सकते हैं। यदि आप किसी के बैग को स्कैन करते हैं, तो ऑब्जेक्ट किसी भी स्थिति में, किसी भी मुद्रा में हो सकते हैं। आप यह भी देख सकते हैं, उदाहरण के लिए, युद्ध के मैदान में जहां लोगों ने अब युद्ध के मैदान में स्वचालित लक्ष्य पहचान लागू की है। युद्ध के मैदान में कुछ भी हो सकता है, इसलिए आप उम्मीद नहीं कर सकते कि चीजें विहित स्थिति में हैं। ऐसे कई अनुप्रयोग हैं जहां यह भेद्यता एक बड़ी समस्या होगी।
Gizmodo: क्या छवियों के कोई अन्य उदाहरण थे जो इसे अध्ययन में नहीं बनाते थे?
गुयेन: कई चित्र हैं। हमने जितना भी शामिल किया है, उससे अधिक जरूर है। मुझे लगता है कि दिलचस्प मामलों को दो प्रकारों में विभाजित किया जा सकता है। एक प्रकार एक स्कूल बस में फायरट्रैक है। मेरे लिए क्या दिलचस्प है क्या आपको केवल एक छोटे से बदलाव की आवश्यकता है। और अब यह बहुत ही उच्च आत्मविश्वास के साथ एक स्कूल बस है। आप इसे केवल कुछ पिक्सेल द्वारा बदल सकते हैं और भविष्यवाणी को किसी अन्य क्लासिफायरफ़ायर में बदला जा सकता है। यह एक संवेदनशीलता मुद्दा है।
दूसरा वाला टैक्सी है। यह बहुत मज़ेदार है, अगर आप इसे दूरबीन के माध्यम से या दाईं ओर सभी तरह से देखते हैं, तो यह एक कांटा लिफ्ट है। ये अन्य पोज़ हैं जो प्रशिक्षण सेट में कभी भी मौजूद नहीं थे, क्योंकि मनुष्यों को उन्हें पकड़ने का कभी मौका नहीं मिला, लेकिन यहां सिमुलेशन के माध्यम से हम किसी भी मुद्रा में वस्तुओं को घुमा सकते हैं और उन्हें पहचान सकते हैं। ये पोज़ कभी ट्रेनिंग सेट में नहीं होते, इसलिए कंप्यूटर को इनके बारे में कभी पता नहीं चलता, लेकिन हम इंसान इसे टैक्सी के रूप में आसानी से पहचान सकते हैं।
गिज़्मोडो: अपने पिछले काम के लिए थोड़ा सा ज़ूम करके, क्या आप अन्य तरीकों के कुछ उदाहरण सूचीबद्ध कर सकते हैं जिनमें छवि मान्यता एआईएस को मूर्ख बनाया गया था? आपके काम के माध्यम से देखे जाने वाले कुछ और आश्चर्यजनक उदाहरण क्या थे?
गुयेन: आप इस परियोजना को देख सकते हैं “ डीप न्यूरल नेटवर्क आसानी से मूर्ख हैं। “ये उस समय के सबसे आश्चर्यजनक थे। हम उन छवियों का एक समूह उत्पन्न करने में सक्षम थे जो शोर की तरह, टीवी स्थिर की तरह दिखते हैं। हालाँकि, नेटवर्क लगभग निश्चित है कि ये चीता, आर्मडिलोस या पांडा हैं। यह एक आश्चर्यजनक परिणाम है। एक और सेट है कि हम अन्य प्रकार के कचरे, चित्र और पैटर्न उत्पन्न करने में सक्षम हैं जो लगभग कुछ भी नहीं की तरह दिखते हैं। लेकिन फिर से उन्हें स्टारफिश, बेसबॉल, इलेक्ट्रिक गिटार और इतने पर वर्गीकृत किया जाता है। नवीनतम कार्य के लगभग विपरीत।
वहाँ भी उन प्रतिकूल उदाहरण हैं जो एक वास्तविक छवि के समान दिखते हैं, जैसे कि यदि आप एक वास्तविक छवि लेते हैं तो आप कुछ पिक्सेल बदलते हैं और अब यह कुछ और के रूप में मिसकॉलिफ़ाइड है। यह एक पुनरावृत्त प्रक्रिया है। प्रत्येक पुनरावृत्ति में हम नेटवर्क के आत्मविश्वास को बढ़ाने की दिशा में कुछ पिक्सेल बदलने की कोशिश करते हैं कि यह कुछ और है। इसलिए पिक्सेल द्वारा पुनरावृत्त रूप से बदलने से, हम एक बिंदु पर पहुंच जाएंगे कि यह छवि केले के रूप में अत्यधिक वर्गीकृत हो जाती है। लेकिन हर पुनरावृत्ति हम केवल कुछ पिक्सेल बदलते हैं।
गुयेन: हम इसे बहुत छोटा होने के लिए बदल सकते हैं, जैसे कि छवि मूल छवि की तरह दिखती है, संशोधित एक मूल छवि की तरह ही दिखता है, और यह भेद्यता के बारे में बहुत ही आकर्षक बात है। इसलिए यदि आपके पास एक स्कूल बस की छवि है, तो आप एक पिक्सेल, एक पिक्सेल, एक पिक्सेल को बदल सकते हैं जब तक कि यह केले के रूप में मिसकॉलिफ़ाइड न हो, लेकिन फिर संशोधित बस स्कूल बस की तरह दिखता है।
Gizmodo: क्या इस मुद्दे पर अभी तक कोई समाधान है, या यह इन छवि पहचान प्रणालियों में अधिक शोध पर निर्भर है?
गुयेन: यह इस बात पर निर्भर करता है कि हम क्या करना चाहते हैं। यदि हम चाहते हैं, मान लें कि आपके पास विश्वसनीय सेल्फ ड्राइविंग कारें हैं, तो वर्तमान समाधान यह है कि इसमें अधिक सेंसर जोड़े जाएं। और वास्तव में आप केवल छवियों के बजाय सेंसर के इन सेट पर भरोसा करते हैं ताकि वर्तमान समाधान हो। यदि आप इस दृष्टि समस्या को हल करना चाहते हैं, तो बस छवियों के आधार पर भविष्यवाणी, तो कोई सामान्य समाधान नहीं है। आजकल एक त्वरित और गंदा हैक अधिक डेटा जोड़ने के लिए है, और मॉडल की दुनिया में स्वाभाविक रूप से वे अधिक से अधिक विश्वसनीय हो जाते हैं, लेकिन फिर यह बहुत सारे डेटा, लाखों डेटा बिंदुओं की लागत पर आता है।
Gizmodo: यह एक दिलचस्प चीज थी, किसी वस्तु को थोड़ा घुमाने के लिए और कुछ को गलत तरीके से। वहाँ एक और तरीका है कि आप देख रहे हैं कि कैसे वस्तुओं या छवियों को हेरफेर किया जाता है जो एआई को मूर्ख बना सकता है?
गुयेन: मूर्ख बनाने के संदर्भ में, यह हमारा नवीनतम कार्य है। हम अब तय करने में अधिक रुचि रखते हैं कि क्या होगा। क्योंकि नवीनतम कार्य पहले से ही दिखाते हैं कि आप एक वस्तु लेते हैं और आप एक छोटा सा परिवर्तन पाते हैं, जब आप इसे घुमाते हैं, और यह एक तंत्रिका जाल को मूर्ख बनाता है। यह पहले से ही मूर्खता का सबसे सरल तरीका है और यह दर्शाता है कि नेटवर्क कितने भंगुर हैं। हम इसे ठीक करने के तरीके के बारे में अधिक देख रहे हैं।

No comments:

Post a Comment

अपने फ़ोन से संदेश भेजने के लिए अपने लैपटॉप का उपयोग कैसे करें

आपको हमेशा 6 इंच की स्क्रीन पर स्क्विंट करने की ज़रूरत नहीं है और अपने संचार को थोड़ा टच कीबोर्ड पर टैप करें।  अधिकांश मैसेजिंग ऐप अब आ...