
मुंबई। बेंगलुरु स्थित स्टार्टअप सरवम एआई ने दावा किया है कि उसके नवीनतम विज़न और स्पीच मॉडल ने भारतीय भाषाओं के लिए ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) और टेक्स्ट-टू-स्पीच बेंचमार्क में गूगल जेमिनी और चैटजीपीटी जैसे बड़े वैश्विक प्रतिस्पर्धियों को पीछे छोड़ दिया है।
सोशल मीडिया प्लेटफॉर्म एक्स पर सरवम एआई के सह-संस्थापक प्रत्युष कुमार ने कहा, “सरवम विज़न ने olmOCR-Bench (सिर्फ अंग्रेज़ी उपसमूह) पर 84.3 प्रतिशत की अत्याधुनिक सटीकता हासिल की है, जो जेमिनी 3 प्रो और डीपसीक ओसीआर 2 जैसे उन्नत मॉडलों से बेहतर है।”
कुमार के अनुसार, OmniDocBench v1.5 (सिर्फ अंग्रेज़ी उपसमूह) पर सरवम विज़न ने 93.28 प्रतिशत का कुल स्कोर हासिल किया है। यह मॉडल जटिल सूत्रों और लेआउट पार्सिंग में उत्कृष्ट प्रदर्शन करते हुए मौजूदा अत्याधुनिक तकनीक के बेहद करीब पहुंच गया है।
उन्होंने यह भी बताया कि कंपनी का ‘बुलबुल V3’ टेक्स्ट-टू-स्पीच मॉडल 22 अनुसूचित भारतीय भाषाओं में 35 अलग-अलग आवाज़ों का समर्थन करता है और विभिन्न गुणवत्ता की स्कैन कॉपी तथा कंटेंट को संभालने में सक्षम है।
कुमार ने दावा किया कि भारतीय भाषाओं के संदर्भ में सरवम विज़न अब तक का सबसे बेहतर मॉडल है और यह सभी 22 अनुसूचित भारतीय भाषाओं का समर्थन करता है।
विज़न सीरीज में 3 अरब पैरामीटर वाला स्टेट-स्पेस मॉडल शामिल है, जो इमेज कैप्शनिंग, सीन टेक्स्ट पहचान, चार्ट विश्लेषण और जटिल तालिकाओं की व्याख्या जैसे कार्य कर सकता है।
सरवम एआई ने कहा कि उसका मुख्य उद्देश्य भारत में कृत्रिम बुद्धिमत्ता को आम लोगों तक पहुंचाना है। कंपनी ने कहा, “हम चाहते हैं कि भारत इस महत्वपूर्ण तकनीकी बदलाव को आत्मविश्वास और नियंत्रण के साथ अपनाए। हमारा लक्ष्य बुनियादी एआई ढांचे का निर्माण कर उसे देश की विशिष्ट जरूरतों के अनुसार लागू करना है।”
कुमार ने सोशल मीडिया पर कई उदाहरण साझा किए, जिनमें प्लेटफॉर्म ने जटिल तालिकाओं में मौजूद तकनीकी शब्दों को सटीक रूप से निकाला। साथ ही, इसने नवीनतम आर्थिक सर्वेक्षण के चार्ट से भी सफलतापूर्वक डेटा निकालकर दिखाया।
दस्तावेज़ों के अलावा, सरवम विज़न ने सामान्य प्राकृतिक दृश्यों को समझने की क्षमता भी प्रदर्शित की, जिसमें सुंदर प्राकृतिक तस्वीरों का सटीक विवरण प्रस्तुत किया गया।
केंद्रीय आईटी मंत्री अश्विनी वैष्णव ने हाल ही में एक्स पर किए गए एक पोस्ट में कहा कि यह स्टार्टअप भारत के एआई मिशन की सफलता को दर्शाता है।
With inputs from IANS