Home World News Openai का कहना है

Openai का कहना है

8
0
Openai का कहना है


कुछ हफ्तों पहले तक, पश्चिमी दुनिया के कुछ लोगों ने एक छोटी चीनी आर्टिफिशियल इंटेलिजेंस (एआई) कंपनी के बारे में सुना था जिसे दीपसेक के रूप में जाना जाता है। लेकिन 20 जनवरी को, यह वैश्विक ध्यान पर कब्जा कर लिया जब इसने R1 नामक एक नया AI मॉडल जारी किया।

R1 एक “तर्क” मॉडल है, जिसका अर्थ है कि यह कार्यों के माध्यम से कदम से कदम उठाता है और उपयोगकर्ता को इसकी कार्य प्रक्रिया का विवरण देता है। यह दीपसेक का अधिक उन्नत संस्करण है वी 3 मॉडलजो दिसंबर में जारी किया गया था। दीपसेक की नई पेशकश लगभग उतनी ही शक्तिशाली है जितनी प्रतिद्वंद्वी कंपनी Openai की सबसे उन्नत AI मॉडल O1, लेकिन लागत के एक अंश पर।

दिनों के भीतर, दीपसेक के ऐप ने नए डाउनलोड में CHATGPT को पार कर लिया और संयुक्त राज्य अमेरिका में तकनीकी कंपनियों के स्टॉक की कीमतें निर्धारित कीं टंबलिंग। इसने Openai को भी ले जाया दावा इसके चीनी प्रतिद्वंद्वी ने ओपनई के मॉडल के कुछ क्राउन ज्वेल्स को प्रभावी रूप से अपने स्वयं के निर्माण के लिए पिल्टर कर दिया था।

में एक न्यूयॉर्क टाइम्स को बयानकंपनी ने कहा:

हम इस बात के बारे में जानते हैं और उन संकेतों की समीक्षा कर रहे हैं कि दीपसेक ने अनुचित रूप से हमारे मॉडल को डिस्टिल्ड किया हो सकता है, और जैसा कि हम अधिक जानते हैं, जानकारी साझा करेंगे। हम अपनी तकनीक की रक्षा के लिए आक्रामक, सक्रिय काउंटरमेशर्स लेते हैं और यहां बनाए जा रहे सबसे सक्षम मॉडल की रक्षा के लिए अमेरिकी सरकार के साथ मिलकर काम करना जारी रखेंगे।

बातचीत के लिए बातचीत ने दीपसेक से संपर्क किया, लेकिन इसने जवाब नहीं दिया।

लेकिन यहां तक ​​कि अगर दीपसेक की नकल की गई – या, वैज्ञानिक पार्लेंस में, “डिस्टिल्ड” – कम से कम कुछ चैटगिप्ट आर 1 का निर्माण करने के लिए, यह याद रखने योग्य है कि ओपनईआई भी अपने मॉडल विकसित करते समय बौद्धिक संपदा का अनादर करने का आरोपी है।

आसवन क्या है?

मॉडल डिस्टिलेशन एक सामान्य मशीन लर्निंग तकनीक है जिसमें एक छोटे “छात्र मॉडल” को एक बड़े और अधिक जटिल “शिक्षक मॉडल” की भविष्यवाणियों पर प्रशिक्षित किया जाता है।

जब पूरा हो जाता है, तो छात्र शिक्षक के रूप में लगभग अच्छा हो सकता है, लेकिन शिक्षक के ज्ञान का अधिक प्रभावी और कॉम्पैक्ट रूप से प्रतिनिधित्व करेगा।

ऐसा करने के लिए, शिक्षक के आंतरिक कामकाज तक पहुंचना आवश्यक नहीं है। सभी को इस ट्रिक को खींचने की जरूरत है, शिक्षक मॉडल से छात्र को प्रशिक्षित करने के लिए पर्याप्त प्रश्न पूछना है।

यह वही है जो Openai ने दावा किया है कि दीपसेक ने किया है: Openai के O1 को एक बड़े पैमाने पर queried और दीपसेक के अपने, अधिक कुशल मॉडल को प्रशिक्षित करने के लिए देखे गए आउटपुट का उपयोग किया।

संसाधनों का एक अंश

दीपसेक दावा R1 के प्रशिक्षण और उपयोग दोनों को अपने प्रतिद्वंद्वियों के सर्वश्रेष्ठ मॉडल को विकसित करने के लिए आवश्यक संसाधनों के केवल एक अंश की आवश्यकता थी।

कंपनी के कुछ विपणन प्रचार के बारे में संदेह होने के कारण हैं – उदाहरण के लिए, ए नई स्वतंत्र रिपोर्ट सुझाव है कि R1 पर हार्डवेयर खर्च US $ 500 मिलियन जितना अधिक था। लेकिन फिर भी, प्रतिद्वंद्वी मॉडल के साथ तुलना में दीपसेक को अभी भी बहुत जल्दी और कुशलता से बनाया गया था।

ऐसा इसलिए हो सकता है क्योंकि डीपसेक ने ओपनई के आउटपुट को डिस्टिल्ड किया है। हालांकि, वर्तमान में इसे निर्णायक रूप से साबित करने के लिए कोई विधि नहीं है। एक विधि जो विकास के शुरुआती चरणों में है वाटरमार्किंग एआई आउटपुट। यह आउटपुट में अदृश्य पैटर्न जोड़ता है, कॉपीराइट की गई छवियों पर लागू होने वाले समान। सिद्धांत रूप में ऐसा करने के विभिन्न तरीके हैं, लेकिन कोई भी प्रभावी या कुशल नहीं है ताकि इसे व्यवहार में बनाया जा सके।

ऐसे अन्य कारण हैं जो डीपसेक की सफलता को समझाने में मदद करते हैं, जैसे कि कंपनी के गहरे और चुनौतीपूर्ण तकनीकी कार्य।

दीपसेक द्वारा किए गए तकनीकी प्रगति में कम शक्तिशाली लेकिन सस्ते एआई चिप्स (जिसे ग्राफिकल प्रोसेसिंग यूनिट्स, या जीपीयू भी कहा जाता है) का लाभ उठाना शामिल था।

दीपसेक के पास अनुकूल होने के अलावा कोई विकल्प नहीं था अमेरिका ने फर्मों पर प्रतिबंध लगा दिया है चीन को सबसे शक्तिशाली एआई चिप्स निर्यात करने से।

जबकि पश्चिमी एआई कंपनियां इन शक्तिशाली इकाइयों को खरीद सकती हैं, निर्यात प्रतिबंध ने चीनी कंपनियों को सस्ते विकल्पों का सबसे अच्छा उपयोग करने के लिए नवाचार करने के लिए मजबूर किया।

अमेरिका ने चीन को सबसे शक्तिशाली कंप्यूटर चिप्स के निर्यात पर प्रतिबंध लगा दिया है। न ही गैल/शटरस्टॉक

मुकदमों की एक श्रृंखला

ओपनई का उपयोग की शर्तें स्पष्ट रूप से राज्य प्रतिस्पर्धी उत्पादों को विकसित करने के लिए अपने एआई मॉडल का उपयोग नहीं कर सकता है। हालांकि, इसके स्वयं के मॉडल वेब से स्क्रैप किए गए बड़े पैमाने पर डेटासेट पर प्रशिक्षित हैं। ये डेटासेट निहित हैं कॉपीराइट सामग्री की पर्याप्त मात्राजो ओपनई कहता है कि यह उपयोग करने का हकदार है “उचित उपयोग” के आधार पर:

सार्वजनिक रूप से उपलब्ध इंटरनेट सामग्री का उपयोग करने वाले एआई मॉडल का प्रशिक्षण उचित उपयोग है, जैसा कि लंबे समय से और व्यापक रूप से स्वीकृत मिसालों द्वारा समर्थित है। हम इस सिद्धांत को रचनाकारों के लिए उचित मानते हैं, इनोवेटर्स के लिए आवश्यक हैं, और अमेरिकी प्रतिस्पर्धा के लिए महत्वपूर्ण हैं।

इस तर्क का परीक्षण अदालत में किया जाएगा। समाचार पत्र, संगीतकारों, लेखक और अन्य क्रिएटिव ने कॉपीराइट उल्लंघन के आधार पर Openai के खिलाफ मुकदमों की एक श्रृंखला दायर की है।

बेशक, यह काफी अलग है कि ओपनई ने दीपसेक पर क्या करने का आरोप लगाया है। फिर भी openai बहुत सहानुभूति को आकर्षित नहीं कर रहा है इसके दावे के लिए कि दीपसेक ने अवैध रूप से अपने मॉडल आउटपुट की कटाई की।

शब्दों और मुकदमों का युद्ध इस बात का एक कला है कि कैसे एआई के तेजी से अग्रिम ने उद्योग के लिए स्पष्ट कानूनी नियमों के विकास को आगे बढ़ाया है। और जबकि इन हालिया घटनाओं से एआई incumbents की शक्ति को कम किया जा सकता है, विभिन्न चल रहे कानूनी विवादों के परिणाम पर बहुत कुछ है।

वैश्विक बातचीत को हिलाते हुए

दीपसेक ने दिखाया है कि सस्ते और कुशलता से अत्याधुनिक मॉडल विकसित करना संभव है। क्या वे एक स्तर के खेल के मैदान पर Openai के साथ प्रतिस्पर्धा कर सकते हैं, यह देखा जाना बाकी है।

सप्ताहांत में, ओपनई ने अपने वर्चस्व को प्रदर्शित करने का प्रयास किया सार्वजनिक रूप से जारी करना इसका सबसे उन्नत उपभोक्ता मॉडल, O3-Mini।

Openai का दावा है कि यह मॉडल अपने स्वयं के पिछले बाजार-अग्रणी संस्करण, O1, और “हमारे तर्क श्रृंखला में सबसे अधिक लागत-कुशल मॉडल” है।

ये घटनाक्रम बाजार में एआई मॉडल की विविधता के साथ उपभोक्ताओं के लिए बढ़ी हुई पसंद का एक युग है। यह उपयोगकर्ताओं के लिए अच्छी खबर है: प्रतिस्पर्धी दबाव मॉडल का उपयोग करने के लिए सस्ता बना देगा।

और लाभ आगे बढ़ते हैं।

इन मॉडलों का प्रशिक्षण और उपयोग करना एक जगह है बड़े पैमाने पर तनाव वैश्विक ऊर्जा की खपत पर। जैसे -जैसे ये मॉडल अधिक सर्वव्यापी हो जाते हैं, हम सभी उनकी दक्षता में सुधार से लाभान्वित होते हैं।

दीपसेक का उदय निश्चित रूप से अधिक सस्ते और कुशलता से मॉडल बनाने के लिए नए क्षेत्र को चिह्नित करता है। शायद यह वैश्विक बातचीत को भी हिला देगा कि कैसे एआई कंपनियों को अपने प्रशिक्षण डेटा को एकत्र और उपयोग करना चाहिए।बातचीत

(लेखक: ली फ्रर्मनप्राकृतिक भाषा प्रसंस्करण में वरिष्ठ व्याख्याता, मेलबर्न विश्वविद्यालय, द यूनिवर्सिटी ऑफ मेलबर्न और शानन कोहनीसाइबर सुरक्षा में व्याख्याता, द यूनिवर्सिटी ऑफ मेलबर्न)

इस लेख को पुनर्प्रकाशित किया गया है बातचीत एक क्रिएटिव कॉमन्स लाइसेंस के तहत। को पढ़िए मूल लेख

(हेडलाइन को छोड़कर, इस कहानी को NDTV कर्मचारियों द्वारा संपादित नहीं किया गया है और एक सिंडिकेटेड फ़ीड से प्रकाशित किया गया है।)


(टैगस्टोट्रांसलेट) Openai



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here