IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू

कृत्रिम बुद्धिमत्ता (AI) के क्षेत्र में एक ऐतिहासिक कदम उठाते हुए OpenAI ने 4 नवंबर 2025 को आधिकारिक रूप से IndQA (इंडक्यूए) नामक एक नया बहुभाषी और संस्कृति-संवेदनशील बेंचमार्क लॉन्च किया है।
यह पहल इस बात का मूल्यांकन करने के लिए तैयार की गई है कि एआई मॉडल भारतीय भाषाओं और सांस्कृतिक संदर्भों पर आधारित प्रश्नों को कितनी सटीकता और समझ के साथ विश्लेषित कर सकते हैं।

भारत, ChatGPT के लिए OpenAI का दूसरा सबसे बड़ा उपयोगकर्ता-आधार है। ऐसे में यह बेंचमार्क भारतीय भाषाई विविधता और सांस्कृतिक गहराई को वैश्विक एआई परिदृश्य में समाहित करने की दिशा में एक बड़ा कदम माना जा रहा है।

IndQA क्या है?

IndQA (Indian Question-Answering Benchmark) एक मूल्यांकन-आधारित ढांचा (evaluation framework) है, जो यह परखने के लिए तैयार किया गया है कि एआई मॉडल भारतीय भाषाओं में पूछे गए प्रश्नों को कैसे समझते, व्याख्या करते और उत्तर देते हैं।

इसमें 2,278 प्रश्न शामिल हैं जो 11 भारतीय भाषाओं में तैयार किए गए हैं —
हिन्दी, हिंग्लिश, गुजराती, पंजाबी, कन्नड़, उड़िया, मराठी, मलयालम, तमिल, बंगाली और तेलुगु।

इन प्रश्नों को भारतीय समाज के 10 प्रमुख सांस्कृतिक और ज्ञान-क्षेत्रों (domains) को ध्यान में रखकर बनाया गया है:

कानून और नैतिकता
वास्तुकला और डिजाइन
भोजन और पाक-परंपरा
दैनिक जीवन
धर्म और आध्यात्मिकता
खेल और मनोरंजन
साहित्य और भाषाविज्ञान
मीडिया और मनोरंजन
कला और संस्कृति
इतिहास

यह परियोजना केवल एक तकनीकी प्रयोग नहीं, बल्कि भारत के सामाजिक-सांस्कृतिक विविधता के प्रति सम्मान का प्रतीक है।

IndQA का विकास कैसे हुआ

IndQA का विकास एक सहयोगात्मक प्रक्रिया के तहत हुआ, जिसमें 261 विशेषज्ञों ने योगदान दिया।
इनमें भाषाविद, पत्रकार, कलाकार, शोधकर्ता, शिक्षाविद और विषय-विशेषज्ञ शामिल थे।

इन विशेषज्ञों ने यह सुनिश्चित किया कि प्रत्येक प्रश्न न केवल भाषाई दृष्टि से सटीक हो, बल्कि सांस्कृतिक संदर्भों से भी प्रासंगिक बना रहे — ताकि बेंचमार्क भारतीय जीवन और सोच की जटिलताओं को सही मायनों में प्रतिबिंबित कर सके।

IndQA कैसे काम करता है?

IndQA का मूल्यांकन एक रूब्रिक-आधारित (Rubric-Based) ग्रेडिंग सिस्टम पर आधारित है।

हर प्रश्न के लिए विशेषज्ञों द्वारा कुछ मूल्यांकन मानदंड (evaluation criteria) तय किए गए हैं।
इन मानदंडों को उनकी प्रासंगिकता और जटिलता के आधार पर अलग-अलग वेटेज (weighted points) दिया गया है।
एआई मॉडल के उत्तरों की तुलना इन मानदंडों से की जाती है।
फिर एक “मॉडल-ग्रेडर” सिस्टम अंतिम स्कोर निर्धारित करता है, जो बताता है कि मॉडल सांस्कृतिक और भाषाई संदर्भों को कितनी गहराई से समझ पाया।

इस प्रक्रिया के जरिए OpenAI यह सुनिश्चित करता है कि मूल्यांकन केवल सटीक उत्तरों पर आधारित न होकर प्रासंगिकता, टोन, और सांस्कृतिक संवेदनशीलता को भी मापे।

किन मॉडलों पर किया गया परीक्षण

IndQA बेंचमार्क को OpenAI और अन्य अग्रणी एआई मॉडलों पर परखा गया, जिनमें शामिल हैं:

मॉडल	कुल प्रदर्शन (%)
GPT-5 (Thinking High)	34.9 (सर्वोच्च)
Gemini 2.5 Pro Thinking	34.3
Gemini 2.5 Flash Thinking	29.7
Grok 4	28.5
OpenAI o3 High	28.1
GPT-4o	20.3
GPT-4 Turbo	12.1

इस तुलना से यह स्पष्ट होता है कि GPT-5 ने सबसे अधिक सटीकता और संदर्भ-संगतता दिखाई, विशेष रूप से भारतीय भाषाओं में।

भाषा-वार प्रदर्शन

सर्वश्रेष्ठ प्रदर्शन: हिन्दी (45%) और हिंग्लिश (44%) में GPT-5 ने शीर्ष स्कोर किया।
सबसे कम प्रदर्शन: बंगाली और तेलुगु, जिनमें कम परिणाम एआई मॉडलों की स्क्रिप्ट-आधारित सीमाओं को दर्शाते हैं।

इससे यह संकेत मिलता है कि जहाँ हिन्दी और हिंग्लिश डेटा-समृद्ध भाषाएँ हैं, वहीं अन्य भारतीय भाषाओं में डिजिटल डेटा और प्रशिक्षण संसाधनों की कमी अभी भी एक चुनौती बनी हुई है।

यह क्रॉस-लैंग्वेज तुलना नहीं है

OpenAI ने स्पष्ट किया है कि IndQA को किसी “भाषा-प्रतिस्पर्धा” के रूप में नहीं देखा जाना चाहिए।
हर भाषा में प्रश्नों की प्रकृति और संदर्भ अलग हैं — इसलिए यह कोई “लीडरबोर्ड” नहीं बल्कि एक within-model benchmark है।

इसका उद्देश्य समय के साथ एक ही मॉडल की विकास-यात्रा और सुधार (progress tracking) को मापना है।
उदाहरण के लिए, भविष्य में GPT-5 या GPT-6 जैसे मॉडल्स IndQA पर दोबारा परखे जाएंगे ताकि यह देखा जा सके कि उन्होंने भारतीय भाषाओं और संस्कृति की समझ में कितना सुधार किया है।

भारत के लिए इसका महत्व

IndQA भारत के एआई भविष्य के लिए अत्यंत महत्वपूर्ण है क्योंकि —

यह भारतीय भाषाओं में एआई विकास को एक वैज्ञानिक दिशा देता है।
स्थानीय डेवलपर्स और शोधकर्ताओं को भाषा-आधारित एआई समाधान तैयार करने में मदद करेगा।
एआई शिक्षा और सरकारी पहल (जैसे Digital India) के तहत बहुभाषी एआई उपयोग को प्रोत्साहित करेगा।
और सबसे बढ़कर, यह सुनिश्चित करेगा कि भारत की सांस्कृतिक और भाषाई पहचान एआई युग में भी सुरक्षित और प्रासंगिक बनी रहे।

IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू

IndQA क्या है?

IndQA का विकास कैसे हुआ

IndQA कैसे काम करता है?

किन मॉडलों पर किया गया परीक्षण

भाषा-वार प्रदर्शन

यह क्रॉस-लैंग्वेज तुलना नहीं है

भारत के लिए इसका महत्व

Like this:

Comments

Leave a ReplyCancel reply

IndQA क्या है?

IndQA का विकास कैसे हुआ

IndQA कैसे काम करता है?

किन मॉडलों पर किया गया परीक्षण

भाषा-वार प्रदर्शन

यह क्रॉस-लैंग्वेज तुलना नहीं है

भारत के लिए इसका महत्व

Share this:

Like this:

Comments

Leave a ReplyCancel reply