शोधकर्ताओं ने एआई प्रणाली के भीतर “खराब वास्तुकला डिजाइन” के बारे में भी चेतावनी दी।
वायर्ड की एक रिपोर्ट के अनुसार, ओपनएआई के चैटजीपीटी और गूगल के जेमिनी जैसे जेनेरिक एआई सिस्टम अधिक उन्नत हो गए हैं, शोधकर्ता अब एआई वर्म्स विकसित कर रहे हैं जो आपके गोपनीय डेटा को चुरा सकते हैं और जेनेरिक एआई सिस्टम के सुरक्षा उपायों को तोड़ सकते हैं।
कॉर्नेल यूनिवर्सिटी, टेक्नियन-इज़राइल इंस्टीट्यूट ऑफ टेक्नोलॉजी और इंटुइट के शोधकर्ताओं ने 'मॉरिस II' नामक पहला जेनरेटिव एआई वर्म बनाया जो डेटा चुरा सकता है या मैलवेयर तैनात कर सकता है और एक सिस्टम से दूसरे सिस्टम में फैल सकता है। इसका नाम पहले वर्म के नाम पर रखा गया है जिसे 1988 में इंटरनेट पर लॉन्च किया गया था। कॉर्नेल टेक के शोधकर्ता बेन नैसी ने कहा, “इसका मूल रूप से मतलब है कि अब आपके पास एक नए तरह के साइबर हमले को अंजाम देने या करने की क्षमता है। यह पहले देखा गया है,”
आउटलेट के अनुसार, एआई वर्म ईमेल डेटा चुराने और स्पैम भेजने के इरादे से जेनरेटिव एआई ईमेल असिस्टेंट पर हमला करके चैटजीपीटी और जेमिनी में कुछ सुरक्षा उपायों का उल्लंघन कर सकता है।
शोधकर्ताओं ने जेनरेटिव एआई वर्म विकसित करने के लिए “प्रतिकूल स्व-प्रतिकृति संकेत” का उपयोग किया। उनके अनुसार, यह प्रॉम्प्ट जेनरेटिव एआई मॉडल को प्रतिक्रिया में एक अलग प्रॉम्प्ट उत्पन्न करने का कारण बनता है। इसे निष्पादित करने के लिए, शोधकर्ताओं ने एक ईमेल सिस्टम बनाया जो चैटजीपीटी, जेमिनी और ओपन-सोर्स एलएलएम को जोड़कर जेनरेटिव एआई का उपयोग करके संदेश भेज और प्राप्त कर सकता था। इसके अलावा, उन्होंने सिस्टम का उपयोग करने के दो तरीके खोजे- एक सेल्फ-रेप्लिकेटिंग प्रॉम्प्ट का उपयोग करके जो टेक्स्ट-आधारित था और एक छवि फ़ाइल के भीतर प्रश्न को एम्बेड करके।
एक मामले में, शोधकर्ताओं ने हमलावरों की भूमिका निभाई और प्रतिकूल टेक्स्ट प्रॉम्प्ट के साथ एक ईमेल भेजा। यह पुनर्प्राप्ति-संवर्धित पीढ़ी का उपयोग करके ईमेल सहायक के डेटाबेस को “जहर” देता है, जो एलएलएम को अपने सिस्टम के बाहर से अधिक डेटा प्राप्त करने की अनुमति देता है। श्री नासी के अनुसार, पुनर्प्राप्ति-संवर्धित पीढ़ी “जेनएआई सेवा को जेलब्रेक करती है” जब यह उपयोगकर्ता की पूछताछ के जवाब में एक ईमेल पुनर्प्राप्त करती है और प्रतिक्रिया उत्पन्न करने के लिए इसे जीपीटी -4 या जेमिनी प्रो को भेजती है। इसके परिणामस्वरूप अंततः ईमेल से डेटा चोरी हो जाता है।
उन्होंने कहा, “संवेदनशील उपयोगकर्ता डेटा वाली उत्पन्न प्रतिक्रिया बाद में नए होस्ट को संक्रमित करती है, जब इसका उपयोग नए क्लाइंट को भेजे गए ईमेल का जवाब देने के लिए किया जाता है और फिर नए क्लाइंट के डेटाबेस में संग्रहीत किया जाता है।”
दूसरी विधि के लिए, शोधकर्ता ने उल्लेख किया, “छवि में स्व-प्रतिकृति संकेत को एन्कोड करके, प्रारंभिक ईमेल भेजे जाने के बाद स्पैम, दुरुपयोग सामग्री, या यहां तक कि प्रचार वाली किसी भी प्रकार की छवि को नए ग्राहकों को आगे भेजा जा सकता है।”
निष्कर्षों को प्रदर्शित करने वाला एक वीडियो ईमेल सिस्टम को बार-बार एक संदेश अग्रेषित करते हुए दिखाता है। शोधकर्ताओं का दावा है कि वे ईमेल डेटा भी प्राप्त कर सकते हैं। श्री नस्सी ने कहा, “यह नाम हो सकते हैं, यह टेलीफोन नंबर, क्रेडिट कार्ड नंबर, एसएसएन, कुछ भी हो सकता है जिसे गोपनीय माना जाता है।”
शोधकर्ताओं ने एआई प्रणाली के भीतर “खराब वास्तुकला डिजाइन” के बारे में भी चेतावनी दी। उन्होंने अपनी टिप्पणियों की सूचना Google और OpenAI को भी दी। ओपनएआई के एक प्रवक्ता ने आउटलेट को बताया, “ऐसा प्रतीत होता है कि उन्होंने उपयोगकर्ता इनपुट पर भरोसा करके शीघ्र-इंजेक्शन प्रकार की कमजोरियों का फायदा उठाने का एक तरीका ढूंढ लिया है, जिसे जांचा या फ़िल्टर नहीं किया गया है।” इसके अलावा, उन्होंने उल्लेख किया कि वे सिस्टम को “अधिक लचीला” बनाने के लिए काम कर रहे हैं और डेवलपर्स को “ऐसे तरीकों का उपयोग करना चाहिए जो सुनिश्चित करें कि वे हानिकारक इनपुट के साथ काम नहीं कर रहे हैं।”
Google ने इस विषय पर टिप्पणी करने से इनकार कर दिया।