IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू
IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू

IndQA: ओपनएआई का पहला सांस्कृतिक बेंचमार्क भारतीय भाषाओं के साथ शुरू

कृत्रिम बुद्धिमत्ता (AI) के क्षेत्र में एक ऐतिहासिक कदम उठाते हुए OpenAI ने 4 नवंबर 2025 को आधिकारिक रूप से IndQA (इंडक्यूए) नामक एक नया बहुभाषी और संस्कृति-संवेदनशील बेंचमार्क लॉन्च किया है।
यह पहल इस बात का मूल्यांकन करने के लिए तैयार की गई है कि एआई मॉडल भारतीय भाषाओं और सांस्कृतिक संदर्भों पर आधारित प्रश्नों को कितनी सटीकता और समझ के साथ विश्लेषित कर सकते हैं।

भारत, ChatGPT के लिए OpenAI का दूसरा सबसे बड़ा उपयोगकर्ता-आधार है। ऐसे में यह बेंचमार्क भारतीय भाषाई विविधता और सांस्कृतिक गहराई को वैश्विक एआई परिदृश्य में समाहित करने की दिशा में एक बड़ा कदम माना जा रहा है।


IndQA क्या है?

IndQA (Indian Question-Answering Benchmark) एक मूल्यांकन-आधारित ढांचा (evaluation framework) है, जो यह परखने के लिए तैयार किया गया है कि एआई मॉडल भारतीय भाषाओं में पूछे गए प्रश्नों को कैसे समझते, व्याख्या करते और उत्तर देते हैं।

इसमें 2,278 प्रश्न शामिल हैं जो 11 भारतीय भाषाओं में तैयार किए गए हैं —
हिन्दी, हिंग्लिश, गुजराती, पंजाबी, कन्नड़, उड़िया, मराठी, मलयालम, तमिल, बंगाली और तेलुगु।

इन प्रश्नों को भारतीय समाज के 10 प्रमुख सांस्कृतिक और ज्ञान-क्षेत्रों (domains) को ध्यान में रखकर बनाया गया है:

  1. कानून और नैतिकता

  2. वास्तुकला और डिजाइन

  3. भोजन और पाक-परंपरा

  4. दैनिक जीवन

  5. धर्म और आध्यात्मिकता

  6. खेल और मनोरंजन

  7. साहित्य और भाषाविज्ञान

  8. मीडिया और मनोरंजन

  9. कला और संस्कृति

  10. इतिहास

यह परियोजना केवल एक तकनीकी प्रयोग नहीं, बल्कि भारत के सामाजिक-सांस्कृतिक विविधता के प्रति सम्मान का प्रतीक है।


IndQA का विकास कैसे हुआ

IndQA का विकास एक सहयोगात्मक प्रक्रिया के तहत हुआ, जिसमें 261 विशेषज्ञों ने योगदान दिया।
इनमें भाषाविद, पत्रकार, कलाकार, शोधकर्ता, शिक्षाविद और विषय-विशेषज्ञ शामिल थे।

इन विशेषज्ञों ने यह सुनिश्चित किया कि प्रत्येक प्रश्न न केवल भाषाई दृष्टि से सटीक हो, बल्कि सांस्कृतिक संदर्भों से भी प्रासंगिक बना रहे — ताकि बेंचमार्क भारतीय जीवन और सोच की जटिलताओं को सही मायनों में प्रतिबिंबित कर सके।


IndQA कैसे काम करता है?

IndQA का मूल्यांकन एक रूब्रिक-आधारित (Rubric-Based) ग्रेडिंग सिस्टम पर आधारित है।

  • हर प्रश्न के लिए विशेषज्ञों द्वारा कुछ मूल्यांकन मानदंड (evaluation criteria) तय किए गए हैं।

  • इन मानदंडों को उनकी प्रासंगिकता और जटिलता के आधार पर अलग-अलग वेटेज (weighted points) दिया गया है।

  • एआई मॉडल के उत्तरों की तुलना इन मानदंडों से की जाती है।

  • फिर एक “मॉडल-ग्रेडर” सिस्टम अंतिम स्कोर निर्धारित करता है, जो बताता है कि मॉडल सांस्कृतिक और भाषाई संदर्भों को कितनी गहराई से समझ पाया।

इस प्रक्रिया के जरिए OpenAI यह सुनिश्चित करता है कि मूल्यांकन केवल सटीक उत्तरों पर आधारित न होकर प्रासंगिकता, टोन, और सांस्कृतिक संवेदनशीलता को भी मापे।


किन मॉडलों पर किया गया परीक्षण

IndQA बेंचमार्क को OpenAI और अन्य अग्रणी एआई मॉडलों पर परखा गया, जिनमें शामिल हैं:

मॉडल कुल प्रदर्शन (%)
GPT-5 (Thinking High) 34.9 (सर्वोच्च)
Gemini 2.5 Pro Thinking 34.3
Gemini 2.5 Flash Thinking 29.7
Grok 4 28.5
OpenAI o3 High 28.1
GPT-4o 20.3
GPT-4 Turbo 12.1

इस तुलना से यह स्पष्ट होता है कि GPT-5 ने सबसे अधिक सटीकता और संदर्भ-संगतता दिखाई, विशेष रूप से भारतीय भाषाओं में।


भाषा-वार प्रदर्शन

  • सर्वश्रेष्ठ प्रदर्शन: हिन्दी (45%) और हिंग्लिश (44%) में GPT-5 ने शीर्ष स्कोर किया।

  • सबसे कम प्रदर्शन: बंगाली और तेलुगु, जिनमें कम परिणाम एआई मॉडलों की स्क्रिप्ट-आधारित सीमाओं को दर्शाते हैं।

इससे यह संकेत मिलता है कि जहाँ हिन्दी और हिंग्लिश डेटा-समृद्ध भाषाएँ हैं, वहीं अन्य भारतीय भाषाओं में डिजिटल डेटा और प्रशिक्षण संसाधनों की कमी अभी भी एक चुनौती बनी हुई है।


यह क्रॉस-लैंग्वेज तुलना नहीं है

OpenAI ने स्पष्ट किया है कि IndQA को किसी “भाषा-प्रतिस्पर्धा” के रूप में नहीं देखा जाना चाहिए।
हर भाषा में प्रश्नों की प्रकृति और संदर्भ अलग हैं — इसलिए यह कोई “लीडरबोर्ड” नहीं बल्कि एक within-model benchmark है।

इसका उद्देश्य समय के साथ एक ही मॉडल की विकास-यात्रा और सुधार (progress tracking) को मापना है।
उदाहरण के लिए, भविष्य में GPT-5 या GPT-6 जैसे मॉडल्स IndQA पर दोबारा परखे जाएंगे ताकि यह देखा जा सके कि उन्होंने भारतीय भाषाओं और संस्कृति की समझ में कितना सुधार किया है।


भारत के लिए इसका महत्व

IndQA भारत के एआई भविष्य के लिए अत्यंत महत्वपूर्ण है क्योंकि —

  • यह भारतीय भाषाओं में एआई विकास को एक वैज्ञानिक दिशा देता है।

  • स्थानीय डेवलपर्स और शोधकर्ताओं को भाषा-आधारित एआई समाधान तैयार करने में मदद करेगा।

  • एआई शिक्षा और सरकारी पहल (जैसे Digital India) के तहत बहुभाषी एआई उपयोग को प्रोत्साहित करेगा।

  • और सबसे बढ़कर, यह सुनिश्चित करेगा कि भारत की सांस्कृतिक और भाषाई पहचान एआई युग में भी सुरक्षित और प्रासंगिक बनी रहे।

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply