कृत्रिम बुद्धिमत्ता (AI) के क्षेत्र में एक ऐतिहासिक कदम उठाते हुए OpenAI ने 4 नवंबर 2025 को आधिकारिक रूप से IndQA (इंडक्यूए) नामक एक नया बहुभाषी और संस्कृति-संवेदनशील बेंचमार्क लॉन्च किया है।
यह पहल इस बात का मूल्यांकन करने के लिए तैयार की गई है कि एआई मॉडल भारतीय भाषाओं और सांस्कृतिक संदर्भों पर आधारित प्रश्नों को कितनी सटीकता और समझ के साथ विश्लेषित कर सकते हैं।
भारत, ChatGPT के लिए OpenAI का दूसरा सबसे बड़ा उपयोगकर्ता-आधार है। ऐसे में यह बेंचमार्क भारतीय भाषाई विविधता और सांस्कृतिक गहराई को वैश्विक एआई परिदृश्य में समाहित करने की दिशा में एक बड़ा कदम माना जा रहा है।
IndQA क्या है?
IndQA (Indian Question-Answering Benchmark) एक मूल्यांकन-आधारित ढांचा (evaluation framework) है, जो यह परखने के लिए तैयार किया गया है कि एआई मॉडल भारतीय भाषाओं में पूछे गए प्रश्नों को कैसे समझते, व्याख्या करते और उत्तर देते हैं।
इसमें 2,278 प्रश्न शामिल हैं जो 11 भारतीय भाषाओं में तैयार किए गए हैं —
हिन्दी, हिंग्लिश, गुजराती, पंजाबी, कन्नड़, उड़िया, मराठी, मलयालम, तमिल, बंगाली और तेलुगु।
इन प्रश्नों को भारतीय समाज के 10 प्रमुख सांस्कृतिक और ज्ञान-क्षेत्रों (domains) को ध्यान में रखकर बनाया गया है:
-
कानून और नैतिकता
-
वास्तुकला और डिजाइन
-
भोजन और पाक-परंपरा
-
दैनिक जीवन
-
धर्म और आध्यात्मिकता
-
खेल और मनोरंजन
-
साहित्य और भाषाविज्ञान
-
मीडिया और मनोरंजन
-
कला और संस्कृति
-
इतिहास
यह परियोजना केवल एक तकनीकी प्रयोग नहीं, बल्कि भारत के सामाजिक-सांस्कृतिक विविधता के प्रति सम्मान का प्रतीक है।
IndQA का विकास कैसे हुआ
IndQA का विकास एक सहयोगात्मक प्रक्रिया के तहत हुआ, जिसमें 261 विशेषज्ञों ने योगदान दिया।
इनमें भाषाविद, पत्रकार, कलाकार, शोधकर्ता, शिक्षाविद और विषय-विशेषज्ञ शामिल थे।
इन विशेषज्ञों ने यह सुनिश्चित किया कि प्रत्येक प्रश्न न केवल भाषाई दृष्टि से सटीक हो, बल्कि सांस्कृतिक संदर्भों से भी प्रासंगिक बना रहे — ताकि बेंचमार्क भारतीय जीवन और सोच की जटिलताओं को सही मायनों में प्रतिबिंबित कर सके।
IndQA कैसे काम करता है?
IndQA का मूल्यांकन एक रूब्रिक-आधारित (Rubric-Based) ग्रेडिंग सिस्टम पर आधारित है।
-
हर प्रश्न के लिए विशेषज्ञों द्वारा कुछ मूल्यांकन मानदंड (evaluation criteria) तय किए गए हैं।
-
इन मानदंडों को उनकी प्रासंगिकता और जटिलता के आधार पर अलग-अलग वेटेज (weighted points) दिया गया है।
-
एआई मॉडल के उत्तरों की तुलना इन मानदंडों से की जाती है।
-
फिर एक “मॉडल-ग्रेडर” सिस्टम अंतिम स्कोर निर्धारित करता है, जो बताता है कि मॉडल सांस्कृतिक और भाषाई संदर्भों को कितनी गहराई से समझ पाया।
इस प्रक्रिया के जरिए OpenAI यह सुनिश्चित करता है कि मूल्यांकन केवल सटीक उत्तरों पर आधारित न होकर प्रासंगिकता, टोन, और सांस्कृतिक संवेदनशीलता को भी मापे।
किन मॉडलों पर किया गया परीक्षण
IndQA बेंचमार्क को OpenAI और अन्य अग्रणी एआई मॉडलों पर परखा गया, जिनमें शामिल हैं:
| मॉडल | कुल प्रदर्शन (%) |
|---|---|
| GPT-5 (Thinking High) | 34.9 (सर्वोच्च) |
| Gemini 2.5 Pro Thinking | 34.3 |
| Gemini 2.5 Flash Thinking | 29.7 |
| Grok 4 | 28.5 |
| OpenAI o3 High | 28.1 |
| GPT-4o | 20.3 |
| GPT-4 Turbo | 12.1 |
इस तुलना से यह स्पष्ट होता है कि GPT-5 ने सबसे अधिक सटीकता और संदर्भ-संगतता दिखाई, विशेष रूप से भारतीय भाषाओं में।
भाषा-वार प्रदर्शन
-
सर्वश्रेष्ठ प्रदर्शन: हिन्दी (45%) और हिंग्लिश (44%) में GPT-5 ने शीर्ष स्कोर किया।
-
सबसे कम प्रदर्शन: बंगाली और तेलुगु, जिनमें कम परिणाम एआई मॉडलों की स्क्रिप्ट-आधारित सीमाओं को दर्शाते हैं।
इससे यह संकेत मिलता है कि जहाँ हिन्दी और हिंग्लिश डेटा-समृद्ध भाषाएँ हैं, वहीं अन्य भारतीय भाषाओं में डिजिटल डेटा और प्रशिक्षण संसाधनों की कमी अभी भी एक चुनौती बनी हुई है।
यह क्रॉस-लैंग्वेज तुलना नहीं है
OpenAI ने स्पष्ट किया है कि IndQA को किसी “भाषा-प्रतिस्पर्धा” के रूप में नहीं देखा जाना चाहिए।
हर भाषा में प्रश्नों की प्रकृति और संदर्भ अलग हैं — इसलिए यह कोई “लीडरबोर्ड” नहीं बल्कि एक within-model benchmark है।
इसका उद्देश्य समय के साथ एक ही मॉडल की विकास-यात्रा और सुधार (progress tracking) को मापना है।
उदाहरण के लिए, भविष्य में GPT-5 या GPT-6 जैसे मॉडल्स IndQA पर दोबारा परखे जाएंगे ताकि यह देखा जा सके कि उन्होंने भारतीय भाषाओं और संस्कृति की समझ में कितना सुधार किया है।
भारत के लिए इसका महत्व
IndQA भारत के एआई भविष्य के लिए अत्यंत महत्वपूर्ण है क्योंकि —
-
यह भारतीय भाषाओं में एआई विकास को एक वैज्ञानिक दिशा देता है।
-
स्थानीय डेवलपर्स और शोधकर्ताओं को भाषा-आधारित एआई समाधान तैयार करने में मदद करेगा।
-
एआई शिक्षा और सरकारी पहल (जैसे Digital India) के तहत बहुभाषी एआई उपयोग को प्रोत्साहित करेगा।
-
और सबसे बढ़कर, यह सुनिश्चित करेगा कि भारत की सांस्कृतिक और भाषाई पहचान एआई युग में भी सुरक्षित और प्रासंगिक बनी रहे।

