सन्दर्भ:
: सात अन्य विशिष्ट भारतीय इंजीनियरिंग संस्थानों के साथ IIT बॉम्बे के नेतृत्व वाले BharatGPT समूह ने घोषणा की है कि वह अगले महीने अपनी पहली ChatGPT जैसी सेवा ‘हनुमान'(Hanooman) शुरू करेगा।
Hanooman के बारे में:
: समूह ने सीता महालक्ष्मी हेल्थकेयर (SML) के सहयोग से इंडिक भाषा मॉडल की ‘Hanooman’ श्रृंखला बनाई।
: Hanooman बड़े भाषा मॉडल (SML) की एक श्रृंखला है जो हिंदी, तमिल और मराठी जैसी 11 भारतीय भाषाओं में प्रतिक्रिया दे सकती है।
: हालाँकि, इसे 20 से अधिक भाषाओं में विस्तार करने की योजना है।
: इसे स्वास्थ्य देखभाल, शासन, वित्तीय सेवाओं और शिक्षा सहित चार क्षेत्रों में काम करने के लिए डिज़ाइन किया गया है।
: यह रिलायंस इंडस्ट्रीज लिमिटेड और विज्ञान और प्रौद्योगिकी विभाग द्वारा समर्थित है।
: ज्ञात हो कि विशेष रूप से, श्रृंखला सिर्फ एक चैटबॉट नहीं है।
: Hanooman एक मल्टीमॉडल AI टूल है, जो कई भारतीय भाषाओं में टेक्स्ट, भाषण, वीडियो और बहुत कुछ उत्पन्न कर सकता है।
: पहले अनुकूलित संस्करणों में से एक VizzhyGPT है, जो एक AI मॉडल है जिसे चिकित्सा डेटा के दायरे का उपयोग करके स्वास्थ्य देखभाल के लिए तैयार किया गया है।
: इन AI मॉडल का आकार 1.5 बिलियन से लेकर 40 बिलियन पैरामीटर तक है।
ChatGPT क्या है?
: ChatGPT OpenAI द्वारा विकसित एक अत्याधुनिक प्राकृतिक भाषा प्रसंस्करण (NLP) मॉडल है।
: यह लोकप्रिय GPT-3 (जेनरेटिव परटेन्ड ट्रांसफार्मर 3) मॉडल का एक प्रकार है, जिसे किसी दिए गए इनपुट पर मानव जैसी प्रतिक्रियाएँ उत्पन्न करने के लिए भारी मात्रा में टेक्स्ट डेटा पर प्रशिक्षित किया गया है।
: इस चैटबॉट द्वारा दिए गए उत्तरों का उद्देश्य तकनीकी और शब्दजाल से मुक्त होना है।
: यह ऐसी प्रतिक्रियाएँ प्रदान कर सकता है जो मानव भाषण की तरह लगती हैं, जिससे उपयोगकर्ता और आभासी सहायक के बीच स्वाभाविक संवाद संभव हो पाता है।
बड़े भाषा मॉडल (LLM- Large Language Model) के बारें:
: बड़े भाषा मॉडल बड़ी मात्रा में पाठ को संसाधित करने के लिए गहन शिक्षण तकनीकों का उपयोग करते हैं।
: वे बड़ी मात्रा में पाठ को संसाधित करके, संरचना और अर्थ को समझकर और उससे सीखकर काम करते हैं।
: LLM को शब्दों के बीच अर्थ और संबंधों की पहचान करने के लिए प्रशिक्षित किया जाता है।
: किसी मॉडल को जितनी अधिक मात्रा में प्रशिक्षण डेटा खिलाया जाता है, वह पाठ को समझने और तैयार करने में उतना ही अधिक कुशल हो जाता है।
• प्रशिक्षण डेटा आमतौर पर विकिपीडिया, ओपनवेबटेक्स्ट और कॉमन क्रॉल कॉर्पस जैसे बड़े डेटासेट होते हैं।
• इनमें बड़ी मात्रा में टेक्स्ट डेटा होता है, जिसका उपयोग मॉडल प्राकृतिक भाषा को समझने और उत्पन्न करने के लिए करते हैं।