Sat. Jul 27th, 2024
HanoomanHanooman
शेयर करें

सन्दर्भ:

: सात अन्य विशिष्ट भारतीय इंजीनियरिंग संस्थानों के साथ IIT बॉम्बे के नेतृत्व वाले BharatGPT समूह ने घोषणा की है कि वह अगले महीने अपनी पहली ChatGPT जैसी सेवा ‘हनुमान'(Hanooman) शुरू करेगा

Hanooman के बारे में:

: समूह ने सीता महालक्ष्मी हेल्थकेयर (SML) के सहयोग से इंडिक भाषा मॉडल की ‘Hanooman’ श्रृंखला बनाई।
: Hanooman बड़े भाषा मॉडल (SML) की एक श्रृंखला है जो हिंदी, तमिल और मराठी जैसी 11 भारतीय भाषाओं में प्रतिक्रिया दे सकती है।
: हालाँकि, इसे 20 से अधिक भाषाओं में विस्तार करने की योजना है।
: इसे स्वास्थ्य देखभाल, शासन, वित्तीय सेवाओं और शिक्षा सहित चार क्षेत्रों में काम करने के लिए डिज़ाइन किया गया है।
: यह रिलायंस इंडस्ट्रीज लिमिटेड और विज्ञान और प्रौद्योगिकी विभाग द्वारा समर्थित है।
: ज्ञात हो कि विशेष रूप से, श्रृंखला सिर्फ एक चैटबॉट नहीं है।
: Hanooman एक मल्टीमॉडल AI टूल है, जो कई भारतीय भाषाओं में टेक्स्ट, भाषण, वीडियो और बहुत कुछ उत्पन्न कर सकता है।
: पहले अनुकूलित संस्करणों में से एक VizzhyGPT है, जो एक AI मॉडल है जिसे चिकित्सा डेटा के दायरे का उपयोग करके स्वास्थ्य देखभाल के लिए तैयार किया गया है।
: इन AI मॉडल का आकार 1.5 बिलियन से लेकर 40 बिलियन पैरामीटर तक है।

ChatGPT क्या है?

: ChatGPT OpenAI द्वारा विकसित एक अत्याधुनिक प्राकृतिक भाषा प्रसंस्करण (NLP) मॉडल है।
: यह लोकप्रिय GPT-3 (जेनरेटिव परटेन्ड ट्रांसफार्मर 3) मॉडल का एक प्रकार है, जिसे किसी दिए गए इनपुट पर मानव जैसी प्रतिक्रियाएँ उत्पन्न करने के लिए भारी मात्रा में टेक्स्ट डेटा पर प्रशिक्षित किया गया है।
: इस चैटबॉट द्वारा दिए गए उत्तरों का उद्देश्य तकनीकी और शब्दजाल से मुक्त होना है।
: यह ऐसी प्रतिक्रियाएँ प्रदान कर सकता है जो मानव भाषण की तरह लगती हैं, जिससे उपयोगकर्ता और आभासी सहायक के बीच स्वाभाविक संवाद संभव हो पाता है।

बड़े भाषा मॉडल (LLM- Large Language Model) के बारें:

: बड़े भाषा मॉडल बड़ी मात्रा में पाठ को संसाधित करने के लिए गहन शिक्षण तकनीकों का उपयोग करते हैं।
: वे बड़ी मात्रा में पाठ को संसाधित करके, संरचना और अर्थ को समझकर और उससे सीखकर काम करते हैं।
: LLM को शब्दों के बीच अर्थ और संबंधों की पहचान करने के लिए प्रशिक्षित किया जाता है।
: किसी मॉडल को जितनी अधिक मात्रा में प्रशिक्षण डेटा खिलाया जाता है, वह पाठ को समझने और तैयार करने में उतना ही अधिक कुशल हो जाता है।
• प्रशिक्षण डेटा आमतौर पर विकिपीडिया, ओपनवेबटेक्स्ट और कॉमन क्रॉल कॉर्पस जैसे बड़े डेटासेट होते हैं।
• इनमें बड़ी मात्रा में टेक्स्ट डेटा होता है, जिसका उपयोग मॉडल प्राकृतिक भाषा को समझने और उत्पन्न करने के लिए करते हैं।


शेयर करें

By gkvidya

Leave a Reply

Your email address will not be published. Required fields are marked *