जैसे-जैसे आर्टिफिशियल इंटेलिजेंस (एआई) की दौड़ तेज होती जा रही है, एलन मस्क के स्वामित्व वाले ग्रोक और चीन के डीपसीक मॉडल अगली पीढ़ी की एआई क्षमताओं में अग्रणी बनकर उभरे हैं – एक पहुंच और दक्षता को प्राथमिकता देता है, दूसरा क्रूर-बल पैमाने की सीमाओं को आगे बढ़ाता है। काउंटरपॉइंट रिसर्च की एक हालिया रिपोर्ट के अनुसार, यह अंतर प्रशिक्षण संसाधनों में महत्वपूर्ण असमानता के बावजूद आता है।
ग्रोक-3 अत्याधुनिक प्रगति की खोज में 200,000 NVIDIA H100 GPU द्वारा संचालित, बिना किसी समझौते के पैमाने का उदाहरण है। इसके विपरीत, डीपसीक-आर1 कम्प्यूटेशनल संसाधनों के एक अंश का उपयोग करके तुलनीय प्रदर्शन प्राप्त करता है, यह दर्शाता है कि कैसे आर्किटेक्चरल इनोवेशन और डेटा क्यूरेशन प्रभावी रूप से विशुद्ध प्रसंस्करण शक्ति का मुकाबला कर सकते हैं।
फरवरी से, डीपसीक ने अपने प्रमुख तर्क मॉडल, डीपसीक-आर1 को ओपन-सोर्स करके वैश्विक ध्यान आकर्षित किया है, जिसने दुनिया के कुछ अग्रणी एआई सिस्टम के बराबर प्रदर्शन का प्रदर्शन किया है। काउंटरपॉइंट में एआई के प्रमुख विश्लेषक वेई सन ने कहा, “जो चीज इसे अलग बनाती है, वह सिर्फ इसकी बेहतरीन क्षमताएं नहीं हैं, बल्कि यह तथ्य है कि इसे केवल 2,000 NVIDIA H800 GPU का उपयोग करके प्रशिक्षित किया गया था – H100 का एक छोटा, निर्यात-अनुरूप विकल्प, जिसने इसकी उपलब्धि को दक्षता में एक मास्टरक्लास बना दिया।
” मस्क के xAI ने Grok-3 का अनावरण किया है, जो अब तक का उसका सबसे उन्नत मॉडल है, जो DeepSeek-R1, OpenAI के GPT-o1 और Google के Gemini 2 से थोड़ा बेहतर प्रदर्शन करता है। “DeepSeek-R1 के विपरीत, Grok-3 मालिकाना है और इसे xAI के सुपरकंप्यूटर कोलोसस पर 200,000 H100 GPU का उपयोग करके प्रशिक्षित किया गया था, जो कम्प्यूटेशनल पैमाने में एक बड़ी छलांग का प्रतिनिधित्व करता है,” सन ने कहा। ग्रोक-3 में जबरदस्त रणनीति अपनाई गई है – बड़े पैमाने पर कंप्यूट स्केल (GPU लागत में अरबों डॉलर का प्रतिनिधित्व करता है) वृद्धिशील प्रदर्शन लाभ को बढ़ावा देता है। यह एक ऐसा मार्ग है जिसे केवल सबसे धनी तकनीकी दिग्गज या सरकारें ही वास्तविक रूप से अपना सकती हैं।
“इसके विपरीत, डीपसीक-आर1, मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) और रीजनिंग के लिए रीइन्फोर्समेंट लर्निंग जैसी तकनीकों का लाभ उठाकर, क्यूरेटेड और उच्च-गुणवत्ता वाले डेटा के साथ मिलकर, कंप्यूट के एक अंश के साथ तुलनीय परिणाम प्राप्त करने के लिए एल्गोरिदमिक सरलता की शक्ति को प्रदर्शित करता है,” सन ने समझाया।
ग्रोक-3 साबित करता है कि 100 गुना अधिक GPU लगाने से तेजी से मामूली प्रदर्शन लाभ मिल सकता है। लेकिन यह निवेश पर तेजी से घटते रिटर्न (ROI) को भी उजागर करता है, क्योंकि अधिकांश वास्तविक दुनिया के उपयोगकर्ता वृद्धिशील सुधारों से न्यूनतम लाभ देखते हैं। संक्षेप में, डीपसीक-आर1 न्यूनतम हार्डवेयर ओवरहेड के साथ बेहतरीन प्रदर्शन प्राप्त करने के बारे में है, जबकि ग्रोक-3 किसी भी आवश्यक कम्प्यूटेशनल माध्यम से सीमाओं को आगे बढ़ाने के बारे में है, रिपोर्ट में कहा गया है।
You may also like
जूता चुराई रस्म में दूल्हे ने दिए 5 हज़ार तो साली ने कहा 'भिखारी', हो गया बवाल
रविवार और भी विशेष होगा! लंच में बनाएं स्वादिष्ट पनीर चीज टिक्की, नोट करें रेसिपी
7 दिनों में आपकी त्वचा दर्पण जैसी हो जाएगी! इस तरह से नियमित रूप से एलोवेरा जेल का इस्तेमाल करें, आपकी त्वचा मुलायम हो जाएगी
प्रदेशभर में मनाया गया भाजपा का स्थापना दिवस, भूपेंद्र चौधरी ने प्रदेश कार्यालय पर फहराया झंडा
रामनवमी पर मुस्लिम महिलाओं ने भगवान राम की आरती उतारी,मनाया जन्मोत्सव