Thursday, July 3, 2025

दीपसेक नहीं ‘चमत्कार’, लेकिन प्रभावशाली: रिपोर्ट में चीनी एआई ऐप का $ 5million का दावा है | टकसाल


दीपसेक की बढ़ती लोकप्रियता के साथ, बर्नस्टीन की हालिया रिपोर्ट में कहा गया है कि चीनी एआई ऐप शानदार दिखता है, लेकिन चमत्कार नहीं है, और यह $ 5 मिलियन के लिए नहीं बनाया गया है।

रिपोर्ट में उल्लेख किया गया है कि दीपसेक का दावा, जो कि $ 5 मिलियन की लागत से निर्मित Openai द्वारा CHATGPT की तुलना में है, झूठा है।

“ऐसा हमारा विश्वास है दीपसेक “$ 5M के लिए Openai का निर्माण नहीं किया”; मॉडल शानदार दिखते हैं, लेकिन हमें नहीं लगता कि वे चमत्कार हैं; और सप्ताहांत में परिणामी ट्विटर-वर्स पैनिक ओवरब्लन लगता है, ” एएनआई बर्नस्टीन रिपोर्ट का हवाला देते हुए रिपोर्ट किया।

बर्नस्टीन के विश्लेषक स्टेसी रसगॉन ने कहा, “उनके द्वारा बनाए गए मॉडल शानदार हैं, लेकिन वे चमत्कार नहीं हैं।” संबंधी प्रेस

एआई मॉडल के दो मुख्य परिवार, ‘डीपसेक-वी 3’ और ‘दीपसेक आर 1‘, चीनी एआई ऐप द्वारा विकसित किया गया है।

V3 मॉडल एक बड़ा भाषा मॉडल है जो विशेषज्ञ (MOE) वास्तुकला के मिश्रण का उपयोग करता है। यह आर्किटेक्चर एक साथ काम करने के लिए कई छोटे मॉडलों को जोड़ती है, जिसके परिणामस्वरूप अन्य बड़े मॉडलों की तुलना में कम संसाधनों का उपयोग करते हुए उच्च प्रदर्शन होता है। कुल मिलाकर, V3 मॉडल में एक समय में लगभग 37 बिलियन सक्रिय उपयोगकर्ताओं के साथ 671 बिलियन पैरामीटर हैं।

इसमें मल्टी-हेड लेटेंट ध्यान (MHLA), मेमोरी उपयोग को कम करना, और दक्षता के लिए FP8 गणना का उपयोग करके मिश्रित-सटीक प्रशिक्षण जैसी नवीन तकनीकें शामिल हैं।

V3 मॉडल के लिए, दीपसेक लगभग दो महीने के लिए 2,048 NVIDIA H800 GPU का एक क्लस्टर, पूर्व-प्रशिक्षण के लिए 2.7 मिलियन GPU घंटे और 2.8 मिलियन GPU घंटे, पोस्ट-ट्रेनिंग सहित।

अनुमानों के अनुसार, इस प्रशिक्षण की लागत $ 2 प्रति GPU घंटे किराये की दर के आधार पर लगभग $ 5 मिलियन होगी। रिपोर्ट का दावा है कि यह राशि मॉडल के विकास के लिए की गई अन्य लागतों के लिए जिम्मेदार नहीं है।

दीपसेक आर 1, जो ओपनईएआई मॉडल के साथ प्रमुख रूप से प्रतिस्पर्धा करता है, वी 3 फाउंडेशन पर बनाया गया है, लेकिन तर्क क्षमताओं में सुधार करने के लिए सुदृढीकरण सीखने (आरएल) और अन्य तकनीकों का उपयोग करता है।

रिपोर्ट में कहा गया है कि आर 1 मॉडल के लिए आवश्यक संसाधन बहुत पर्याप्त थे और कंपनी द्वारा इसका हिसाब नहीं दिया गया था।

हालांकि, रिपोर्ट ने स्वीकार किया कि दीपसेक के मॉडल प्रभावशाली हैं, लेकिन $ 5 मिलियन के लिए एक Openai प्रतियोगी के निर्माण के बारे में घबराहट और अतिरंजित दावे गलत हैं।



Source link

Hot this week

Food blogger Chatori Rajni’s 16-year-old son passes in a road accident- News18

Last update:February 19, 2025, 18:42 ISTFood blogger Rajni Jain,...

WordPress News Magazine Charts the Most Chic and Fashionable Women of New York City

We woke reasonably late following the feast and free...

ब्रायन थॉम्पसन की नेट वर्थ: द लेट यूनाइटेडहेल्थकेयर के सीईओ का वेतन

देखें गैलरी ब्रायन थॉम्पसन तीन साल के लिए यूनाइटेडहेल्थकेयर...

पहुंच अस्वीकृत

पहुंच अस्वीकृत आपके पास इस सर्वर पर...
spot_img

Related Articles

Popular Categories

spot_imgspot_img