
नई दिल्ली। बेंगलुरु स्थित एआई स्टार्टअप Sarvam AI ने भारत की संप्रभु (सॉवरेन) आर्टिफिशियल इंटेलिजेंस क्षमताओं को मजबूत करने की दिशा में दो नए बड़े लैंग्वेज मॉडल (LLMs) पेश किए।
यह घोषणा यहां आयोजित India AI Impact Summit में की गई। कंपनी के अनुसार, दोनों मॉडलों को मिक्सचर-ऑफ-एक्सपर्ट्स (MoE) आर्किटेक्चर के साथ शुरू से प्रशिक्षित किया गया है, जिससे दक्षता और प्रदर्शन में सुधार होता है।
पहला मॉडल Sarvam 30B है, जिसमें 30 अरब पैरामीटर हैं। हालांकि, कंपनी का कहना है कि हर आउटपुट टोकन के लिए केवल 1 अरब पैरामीटर सक्रिय होते हैं।
सह-संस्थापक Pratyush Kumar ने बताया कि MoE संरचना इंफेरेंस लागत को कम करती है और विशेष रूप से रीजनिंग व जटिल वर्कलोड के लिए दक्षता बढ़ाती है। उनका दावा है कि 30B मॉडल 8K और 16K स्केल पर थिंकिंग और रीजनिंग बेंचमार्क में समान आकार के अन्य मॉडलों की तुलना में मजबूत प्रदर्शन करता है।
Sarvam 30B मॉडल 32,000-टोकन कॉन्टेक्स्ट विंडो को सपोर्ट करता है और इसे 16 ट्रिलियन टोकन पर प्रशिक्षित किया गया है। कुमार के अनुसार, कंपनी का लक्ष्य दक्षता को केंद्र में रखते हुए भारत की बड़ी आबादी तक एआई को सुलभ बनाना है।
कंपनी ने 105 अरब पैरामीटर वाला एक बड़ा मॉडल भी पेश किया, जिसे उन्नत रीजनिंग और एजेंट-आधारित कार्यों के लिए डिज़ाइन किया गया है। यह मॉडल 9 अरब पैरामीटर सक्रिय करता है और 128,000-टोकन कॉन्टेक्स्ट विंडो सपोर्ट करता है, जिससे यह जटिल निर्देशों और लंबी बातचीत को संभाल सकता है।
कुमार ने 105B मॉडल की तुलना वैश्विक फ्रंटियर सिस्टम्स से की। उन्होंने दावा किया कि कई बेंचमार्क पर यह DeepSeek के DeepSeek R1 से बेहतर प्रदर्शन करता है, जिसे पिछले वर्ष 600 अरब पैरामीटर के साथ पेश किया गया था।
उन्होंने यह भी कहा कि यह मॉडल Google के Gemini Flash की तुलना में सस्ता है और कई बेंचमार्क पर बेहतर प्रदर्शन देता है। यहां तक कि Gemini 2.5 Flash के मुकाबले भी भारतीय भाषाओं के कार्यों में Sarvam का मॉडल अधिक मजबूत बताया गया।
यह लॉन्च ऐसे समय में हुआ है जब भारत बहुभाषी और बड़े पैमाने के सार्वजनिक उपयोग मामलों के लिए अपने स्वयं के फाउंडेशनल एआई मॉडल विकसित करने के प्रयास तेज कर रहा है।
सरकार समर्थित IndiaAI Mission, जिसे 10,000 करोड़ रुपये के फंड का समर्थन प्राप्त है, का उद्देश्य विदेशी एआई प्रणालियों पर निर्भरता कम करना और घरेलू नवाचार को बढ़ावा देना है।
अब तक मिशन के तहत 111 करोड़ रुपये की GPU सब्सिडी वितरित की जा चुकी है। Sarvam AI सबसे बड़ा लाभार्थी बनकर उभरा है, जिसे Yotta Data Services के माध्यम से 4,096 NVIDIA H100 SXM GPUs आवंटित किए गए और लगभग 99 करोड़ रुपये की सब्सिडी मिली।
इससे पहले, स्टार्टअप को मिशन के तहत भारत का फाउंडेशनल एआई मॉडल विकसित करने वाली पहली कंपनी के रूप में चुना गया था।
Sarvam AI की स्थापना जुलाई 2023 में Vivek Raghavan और प्रात्युश कुमार ने की थी। दोनों पहले AI4Bharat से जुड़े रहे हैं, जिसे इंफोसिस के सह-संस्थापक Nandan Nilekani का समर्थन प्राप्त है।
With inputs from IANS