Home Technology दीपसेक ने नए एआई मॉडल को लॉन्च करने के लिए दौड़ लगाई क्योंकि चीन सभी में जाता है

दीपसेक ने नए एआई मॉडल को लॉन्च करने के लिए दौड़ लगाई क्योंकि चीन सभी में जाता है

0
दीपसेक ने नए एआई मॉडल को लॉन्च करने के लिए दौड़ लगाई क्योंकि चीन सभी में जाता है



दीपसेक अपने लाभ को घर पर दबाने के लिए देख रहा है। चीनी स्टार्टअप ने $ 1 ट्रिलियन (लगभग 8,72,00,30 करोड़ रुपये) को ट्रिगर किया था, जो पिछले महीने वैश्विक इक्विटीज़ बाजारों में कट-प्राइस एआई रीज़निंग मॉडल के साथ-साथ कई पश्चिमी प्रतियोगियों को पछाड़ देता था।

अब, हांग्जो-आधारित फर्म कंपनी से परिचित तीन लोगों के अनुसार, जनवरी के आर 1 मॉडल के उत्तराधिकारी के लॉन्च को तेज कर रही है।

दीपसेक मई की शुरुआत में R2 को छोड़ने की योजना बनाई थी, लेकिन अब यह जल्द से जल्द बाहर करना चाहता है, उनमें से दो ने कहा, बिना बारीकियों को प्रदान किए।

कंपनी का कहना है कि उसे उम्मीद है कि नया मॉडल बेहतर कोडिंग का उत्पादन करेगा और अंग्रेजी से परे भाषाओं में तर्क करने में सक्षम होगा। R2 की रिहाई के लिए त्वरित समयरेखा का विवरण पहले रिपोर्ट नहीं किया गया है।

दीपसेक ने इस कहानी के लिए टिप्पणी के अनुरोध का जवाब नहीं दिया।

प्रतिद्वंद्वी अभी भी R1 के निहितार्थ को पच रहे हैं, जो कम शक्तिशाली NVIDIA चिप्स के साथ बनाया गया था, लेकिन अमेरिकी टेक दिग्गजों द्वारा सैकड़ों अरबों डॉलर की लागत से विकसित लोगों के साथ प्रतिस्पर्धी है।

भारतीय तकनीकी सेवा प्रदाता ज़ेंसर के मुख्य परिचालन अधिकारी विजयसिम्हा अलिलुघट्टा ने कहा, “डीपसेक के आर 2 मॉडल का लॉन्च एआई उद्योग में एक महत्वपूर्ण क्षण हो सकता है।” लागत प्रभावी एआई मॉडल बनाने में दीपसेक की सफलता “दुनिया भर में कंपनियों को अपने स्वयं के प्रयासों में तेजी लाने की संभावना होगी … क्षेत्र में कुछ प्रमुख खिलाड़ियों के गला घोंटने को तोड़ते हुए,” उन्होंने कहा।

R2 को अमेरिकी सरकार की चिंता करने की संभावना है, जिसने AI के नेतृत्व को राष्ट्रीय प्राथमिकता के रूप में पहचाना है। इसकी रिलीज़ से चीनी अधिकारियों और कंपनियों को आगे बढ़ाया जा सकता है, जिनमें से दर्जनों का कहना है कि उन्होंने अपने उत्पादों में डीपसेक मॉडल को एकीकृत करना शुरू कर दिया है।

लिटिल को दीपसेक के बारे में जाना जाता है, जिनके संस्थापक लियांग वेनफेंग अपने मात्रात्मक हेज फंड हाई-फ्लायर के माध्यम से एक अरबपति बन गए। लिआंग, जिन्हें एक पूर्व नियोक्ता द्वारा “कम-कुंजी और अंतर्मुखी” के रूप में वर्णित किया गया था, ने जुलाई 2024 से किसी भी मीडिया से बात नहीं की है।

रॉयटर्स ने एक दर्जन पूर्व कर्मचारियों का साक्षात्कार लिया, साथ ही क्वांट फंड पेशेवरों ने दीपसेक और इसकी मूल कंपनी के उच्च-फ्लायर के संचालन के बारे में जानकार किया। इसने राज्य मीडिया लेखों, कंपनियों से सोशल-मीडिया पोस्ट और 2019 में वापस डेटिंग किए गए शोध पत्रों की भी समीक्षा की।

उन्होंने एक कंपनी की एक कहानी बताई, जो एक लाभ-लाभ उद्यम की तुलना में एक शोध प्रयोगशाला की तरह अधिक काम करती थी और चीन के उच्च दबाव वाले तकनीकी उद्योग की पदानुक्रमित परंपराओं से अप्रभावित थी, यहां तक ​​कि यह कई निवेशकों के लिए जिम्मेदार हो गया था कि कई निवेशकों ने नवीनतम सफलता के रूप में क्या देखा है।

अलग -अलग पथ

लियांग का जन्म 1985 में दक्षिणी प्रांत गुआंगडोंग के एक ग्रामीण गाँव में हुआ था। बाद में उन्होंने एलीट झेजियांग विश्वविद्यालय में संचार इंजीनियरिंग डिग्री प्राप्त की।

उनकी पहली नौकरियों में से एक शंघाई में एक स्मार्ट इमेजिंग फर्म में एक शोध विभाग चला रहा था। उनके तत्कालीन बॉस, झोउ चोएन ने 9 फरवरी को स्टेट मीडिया को बताया कि लियांग ने पुरस्कार विजेता एल्गोरिथ्म इंजीनियर को काम पर रखा था और “फ्लैट प्रबंधन शैली” के साथ संचालित किया था।

दीपसेक और हाई-फ्लाइर में, लियांग ने इसी तरह से कठोर टॉप-डाउन प्रबंधन के लिए जाने जाने वाले चीनी तकनीकी दिग्गजों की प्रथाओं को दूर कर दिया है, युवा कर्मचारियों के लिए कम वेतन और “996”-सप्ताह में छह दिन सुबह 9 बजे से 9 बजे तक काम करना।

लियांग ने अपने बीजिंग कार्यालय को सिंघुआ विश्वविद्यालय और पेकिंग विश्वविद्यालय, चीन के दो सबसे प्रतिष्ठित शिक्षा संस्थानों की पैदल दूरी के भीतर खोला। उन्होंने नियमित रूप से तकनीकी विवरणों में तल्लीन किया और दो पूर्व कर्मचारियों के अनुसार, जीन-जेड इंटर्न और हाल के स्नातकों के साथ काम करने के लिए खुश थे, जिनमें इसके कार्यबल के थोक शामिल थे। उन्होंने आमतौर पर एक सहयोगी माहौल में आठ घंटे के दिनों में काम करने का वर्णन किया।

26 वर्षीय शोधकर्ता बेंजामिन लियू ने कहा, “लियांग ने हमें नियंत्रण दिया और हमें विशेषज्ञों के रूप में व्यवहार किया। उन्होंने लगातार सवाल पूछे और हमारे साथ सीखा।” “दीपसेक ने मुझे पाइपलाइन के महत्वपूर्ण हिस्सों का स्वामित्व लेने की अनुमति दी, जो बहुत रोमांचक था।”

लिआंग ने दीपसेक के माध्यम से भेजे गए सवालों का जवाब नहीं दिया।

जबकि Baidu और अन्य चीनी तकनीकी दिग्गज अपने उपभोक्ता-सामना करने वाले संस्करणों के निर्माण के लिए दौड़ रहे थे चटपट 2023 में और वैश्विक एआई बूम से लाभ, लियांग ने पिछले साल चीनी मीडिया आउटलेट लहरों को बताया कि वह जानबूझकर ऐप के विकास पर भारी खर्च करने से बचता था, एआई मॉडल की गुणवत्ता को परिष्कृत करने के बजाय ध्यान केंद्रित करता था।

डीपसेक और हाई-फ्लाइर दोनों को उदारता से भुगतान करने के लिए जाना जाता है, इसके मुआवजे की प्रथाओं से परिचित तीन लोगों के अनुसार। हाई-फ्लायर में, एक वरिष्ठ डेटा वैज्ञानिक के लिए सालाना 1.5 मिलियन (लगभग 1.8 लाख रुपये) बनाने के लिए एक वरिष्ठ डेटा वैज्ञानिक के लिए असामान्य नहीं है, जबकि प्रतियोगियों ने शायद ही कभी 800,000 से अधिक का भुगतान किया है, एक प्रतिद्वंद्वी क्वांट फंड मैनेजर, जो लिआंग को जानता है।

लार्गेसी को हाई-फ्लायर द्वारा वित्त पोषित किया गया था, जो चीन के सबसे सफल क्वांट फंड में से एक बन गया और इस क्षेत्र में एक सरकारी कार्रवाई के बाद भी, उद्योग में दो लोगों के अनुसार, अभी भी दसियों अरबों युआन का प्रबंधन करता है।

कम्प्यूटिंग शक्ति

कम लागत वाले एआई मॉडल के साथ दीपसेक की सफलता उच्च-फ्लाइर के दशक-लंबे और अनुसंधान और कंप्यूटिंग शक्ति में पर्याप्त निवेश पर आधारित है, तीन लोगों ने कहा।

क्वांट फंड एआई ट्रेडिंग में एक पहले का अग्रणी था और एक शीर्ष कार्यकारी ने 2020 में कहा कि हाई-फ्लाईर एआई पर “सभी में” जा रहा था, जो कि 70 प्रतिशत राजस्व का फिर से निवेश कर रहा था, ज्यादातर एआई अनुसंधान में।

2020 और 2021 में दो सुपरकंप्यूटिंग एआई समूहों पर उच्च-फ्लाइर ने 1.2 बिलियन (लगभग 1,441 करोड़ रुपये) खर्च किए। दूसरा क्लस्टर, फायर-फ्लाईर II, लगभग 10,000 एनवीडिया ए 100 चिप्स से बना था, जिसका उपयोग एआई मॉडल के प्रशिक्षण के लिए किया गया था।

उस समय दीपसेक की स्थापना नहीं की गई थी, इसलिए कम्प्यूटिंग पावर के संचय ने चीनी प्रतिभूति नियामकों का ध्यान आकर्षित किया, एक व्यक्ति ने अधिकारियों की सोच के प्रत्यक्ष ज्ञान के साथ कहा।

“नियामक जानना चाहते थे कि उन्हें इतने सारे चिप्स की आवश्यकता क्यों है?” व्यक्ति ने कहा। “वे इसका उपयोग कैसे करने जा रहे थे? बाजार पर किस तरह का प्रभाव पड़ेगा?”

अधिकारियों ने हस्तक्षेप नहीं करने का फैसला किया, एक ऐसे कदम में जो दीपसेक की किस्मत के लिए महत्वपूर्ण साबित होगा: अमेरिका ने 2022 में चीन को A100 चिप्स के निर्यात पर प्रतिबंध लगा दिया, जिस बिंदु पर फायर-फ्लेयर II पहले से ही ऑपरेशन में था।

बीजिंग अब दीपसेक मनाता है, लेकिन चीनी आधिकारिक सोच से परिचित व्यक्ति के अनुसार, बिना अनुमोदन के मीडिया के साथ संलग्न नहीं होने का निर्देश दिया है।

अधिकारियों ने लियांग को एक लो-प्रोफाइल रखने के लिए कहा था क्योंकि वे चिंतित थे कि मीडिया में बहुत अधिक प्रचार अनावश्यक ध्यान आकर्षित करेगा, व्यक्ति ने कहा।

चीन के कैबिनेट और वाणिज्य मंत्रालय, साथ ही चीन के प्रतिभूति नियामक, ने टिप्पणी के अनुरोधों का जवाब नहीं दिया।

एक बड़े A100 क्लस्टर के साथ कुछ कंपनियों में से एक के रूप में, उच्च-फ्लाइर और दीपसेक चीन के कुछ सर्वश्रेष्ठ अनुसंधान प्रतिभा को आकर्षित करने में सक्षम थे, दो पूर्व कर्मचारियों ने कहा।

पूर्व कर्मचारी लियू ने कहा, “विशाल (कंप्यूटिंग) संसाधनों का प्रमुख लाभ यह है कि यह बड़े पैमाने पर प्रयोग के लिए अनुमति देता है।”

कुछ पश्चिमी एआई उद्यमियों, जैसे स्केल एआई के सीईओ अलेक्जेंड्र वांग ने दावा किया है कि दीपसेक के पास 50,000 उच्च-स्तरीय एनवीडिया चिप्स थे जो चीन को निर्यात के लिए प्रतिबंधित हैं। उन्होंने आरोप के लिए सबूत नहीं दिए हैं या सबूत प्रदान करने के लिए रायटर के अनुरोधों का जवाब दिया है।

दीपसेक ने वांग के दावों का जवाब नहीं दिया है। दो पूर्व कर्मचारियों ने कंपनी की सफलता को लियांग के अधिक लागत प्रभावी एआई वास्तुकला पर ध्यान केंद्रित करने के लिए जिम्मेदार ठहराया।

स्टार्टअप ने मिक्सचर-ऑफ-एक्सपेर्ट्स (एमओई) और मल्टीहेड लेटेंट अटेंशन (एमएलए) जैसी तकनीकों का इस्तेमाल किया, जो कम कंप्यूटिंग लागत को कम करते हैं, इसके शोध पत्र दिखाते हैं।

एमओई तकनीक एक एआई मॉडल को विशेषज्ञता के विभिन्न क्षेत्रों में विभाजित करती है और केवल एक क्वेरी से संबंधित उन लोगों को सक्रिय करती है, जो पूरे मॉडल का उपयोग करने वाले अधिक सामान्य आर्किटेक्चर के विपरीत है।

एमएलए आर्किटेक्चर एक मॉडल को एक साथ जानकारी के एक टुकड़े के विभिन्न पहलुओं को संसाधित करने की अनुमति देता है, जिससे यह महत्वपूर्ण विवरणों का अधिक प्रभावी ढंग से पता लगाने में मदद करता है।

जबकि फ्रांस के मिस्ट्रल जैसे प्रतियोगियों ने एमओई पर आधारित मॉडल विकसित किए हैं, डीपसेक इस वास्तुकला पर बहुत अधिक निर्भरता पर निर्भर रहने वाली पहली फर्म थी, जबकि अधिक महंगे रूप से निर्मित मॉडल के साथ समता प्राप्त करती थी।

दीपसेक का मूल्य 20 से 40 गुना सस्ता था ओपनई बराबर मॉडल के लिए शुल्क लिया गया, फरवरी की शुरुआत में बर्नस्टीन ब्रोकरेज के विश्लेषकों का अनुमान लगाया गया।

अभी के लिए, पश्चिमी और चीनी टेक दिग्गजों ने भारी एआई खर्च को जारी रखने की योजना का संकेत दिया है, लेकिन आर 1 और इसके पहले के वी 3 मॉडल के साथ दीपसेक की सफलता ने कुछ रणनीतियों को बदलने के लिए प्रेरित किया है।

Openai ने इस महीने की कीमतों में कटौती की, जबकि Google की मिथुन एक्सेस के रियायती स्तरों को पेश किया है। R1 के लॉन्च के बाद से, Openai ने एक O3-Mini मॉडल भी जारी किया है जो कम कंप्यूटिंग पावर पर निर्भर करता है।

यूएस टेक सर्विसेज प्रदाता यूएसटी के अदनान मसूद ने रॉयटर्स को बताया कि उनकी प्रयोगशाला ने बेंचमार्क चलाए थे, जिसमें पाया गया कि आर 1 ने अक्सर तीन बार टोकन, या एआई मॉडल द्वारा संसाधित डेटा की इकाइयों का उपयोग किया था, ओपनई के स्केल-डाउन मॉडल के रूप में तर्क करने के लिए।

राज्य को गले लगाना

आर 1 ने वैश्विक ध्यान आकर्षित करने से पहले ही, ऐसे संकेत थे कि दीपसेक ने बीजिंग के पक्ष को पकड़ लिया था। जनवरी में, स्टेट मीडिया ने बताया कि लिआंग ने बीजिंग में चीनी प्रीमियर ली किआंग के साथ एआई सेक्टर के नामित प्रतिनिधि के रूप में एक बैठक में भाग लिया, जो बेहतर ज्ञात फर्मों के नेताओं से आगे था।

अपने मॉडलों की लागत प्रतिस्पर्धा पर बाद की धूमधाम ने बीजिंग के विश्वास को उकसाया है कि यह अमेरिका को बाहर कर सकता है, चीनी कंपनियों और सरकारी निकायों ने डीपसेक मॉडल को एक गति से गले लगाकर अन्य फर्मों को पेश नहीं किया है।

कम से कम 13 चीनी शहर की सरकारों और 10 राज्य के स्वामित्व वाली ऊर्जा कंपनियों का कहना है कि उन्होंने अपने सिस्टम में दीपसेक को तैनात किया है, जबकि टेक दिग्गज लेनोवो, बैडू और टेन्सेंट – चीन के सबसे बड़े सोशल मीडिया ऐप वीचैट के मालिक – ने अपने उत्पादों में दीपसेक के मॉडल को एकीकृत किया है।

सिंगापुर के ली कुआन यू स्कूल ऑफ पब्लिक पॉलिसी में चीनी नीति निर्धारण के विशेषज्ञ अल्फ्रेड वू ने कहा, “चीनी नेता शी जिनपिंग और ली ने” दीपसेक का समर्थन किया है। ” “अब हर कोई सिर्फ इसका समर्थन करता है।”

चीनी आलिंगन दक्षिण कोरिया से इटली तक की सरकारों के रूप में आता है, जो गोपनीयता की चिंताओं का हवाला देते हुए, राष्ट्रीय ऐप स्टोर से दीपसेक को हटा देता है।

एआई फंड कार्थेज कैपिटल के एआई विशेषज्ञ और संस्थापक स्टीफन वू ने कहा, “अगर डीपसेक चीनी राज्य संस्थाओं में एआई-टू एआई मॉडल बन जाता है, तो पश्चिमी नियामक इसे एआई चिप्स या सॉफ्टवेयर सहयोगों पर प्रतिबंधों को बढ़ाने के लिए एक और कारण के रूप में देख सकते हैं,” एआई फंड कार्थेज कैपिटल के एआई विशेषज्ञ और संस्थापक स्टीफन वू ने कहा।

उन्नत एआई चिप्स पर आगे की सीमा एक चुनौती है जिसे लियांग ने स्वीकार किया है।

“हमारी समस्या कभी भी वित्त पोषण नहीं हुई है,” उन्होंने जुलाई में लहरों को बताया। “यह हाई-एंड चिप्स पर एम्बार्गो है।”

© थॉमसन रॉयटर्स 2025

(यह कहानी NDTV कर्मचारियों द्वारा संपादित नहीं की गई है और एक सिंडिकेटेड फ़ीड से ऑटो-जनरेट किया गया है।)





Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here