सन्दर्भ:
: हाल ही में जारी एक सरकारी वर्किंग पेपर में सुझाव दिया गया है कि ChatGPT जैसे AI लार्ज लैंग्वेज मॉडल (LLMs) को डिफ़ॉल्ट रूप से ऑनलाइन मुफ़्त में उपलब्ध कंटेंट तक पहुंच मिलनी चाहिए, और पब्लिशर्स के पास ऐसे कंटेंट के लिए ऑप्ट-आउट मैकेनिज्म नहीं होना चाहिए।
लार्ज लैंग्वेज मॉडल के बारें में:
- LLM एक तरह का आर्टिफिशियल इंटेलिजेंस (AI) प्रोग्राम है जो दूसरे कामों के अलावा टेक्स्ट को पहचान और जेनरेट कर सकता है।
- LLM को बहुत बड़े डेटा सेट पर ट्रेन किया जाता है, इसीलिए इसका नाम “लार्ज” है।
- LLM मशीन लर्निंग पर बने होते हैं: खास तौर पर, एक तरह का न्यूरल नेटवर्क जिसे ट्रांसफ़ॉर्मर मॉडल कहा जाता है, जो शब्दों के सीक्वेंस को संभालने और टेक्स्ट में पैटर्न को पहचानने में माहिर होता है।
- आसान शब्दों में, LLM एक कंप्यूटर प्रोग्राम है जिसे इंसानी भाषा या दूसरे तरह के कॉम्प्लेक्स डेटा को पहचानने और समझने के लिए काफ़ी उदाहरण दिए गए हैं।
- कई LLM को इंटरनेट से इकट्ठा किए गए डेटा पर ट्रेन किया जाता है – हज़ारों या लाखों गीगाबाइट का टेक्स्ट।
- लेकिन सैंपल की क्वालिटी इस बात पर असर डालती है कि LLM नेचुरल भाषा को कितनी अच्छी तरह सीखेंगे, इसलिए LLM के प्रोग्रामर ज़्यादा क्यूरेटेड डेटा सेट का इस्तेमाल कर सकते हैं।
- LLM डीप लर्निंग नाम की मशीन लर्निंग का इस्तेमाल करते हैं ताकि यह समझ सकें कि कैरेक्टर, शब्द और वाक्य एक साथ कैसे काम करते हैं।
- डीप लर्निंग में अनस्ट्रक्चर्ड डेटा का प्रोबेबिलिस्टिक एनालिसिस शामिल होता है, जो आखिरकार डीप लर्निंग मॉडल को इंसानी दखल के बिना कंटेंट के टुकड़ों के बीच अंतर पहचानने में मदद करता है।
- फिर LLM को ट्यूनिंग के ज़रिए और ट्रेन किया जाता है: उन्हें उस खास काम के लिए फाइन-ट्यून या प्रॉम्प्ट-ट्यून किया जाता है जो प्रोग्रामर उनसे करवाना चाहता है।
- LLM का इस्तेमाल किस लिए किया जाता है?
- LLM कई तरह के भाषा से जुड़े काम कर सकते हैं, जैसे सवालों के जवाब देना, टेक्स्ट को समराइज़ करना, भाषाओं के बीच ट्रांसलेट करना और कंटेंट लिखना।
- कंपनियाँ LLM-आधारित एप्लिकेशन का इस्तेमाल कर्मचारियों की प्रोडक्टिविटी और एफिशिएंसी को बेहतर बनाने, ग्राहकों को पर्सनलाइज़्ड रिकमेंडेशन देने और आइडिया, इनोवेशन और प्रोडक्ट डेवलपमेंट को तेज़ करने के लिए करती हैं।
- LLM आज के कुछ सबसे ज़्यादा इस्तेमाल होने वाले टेक्स्ट-फोकस्ड जेनरेटिव AI (GenAI) टूल, जैसे ChatGPT, Claude, Microsoft Copilot, Gemini और Meta AI के पीछे की बुनियादी ताकत हैं।
- चूंकि LLM अब मल्टीमॉडल (टेक्स्ट के अलावा दूसरे मीडिया टाइप के साथ काम करना) बन रहे हैं, इसलिए उन्हें अब “फाउंडेशन मॉडल” भी कहा जाता है।
- हालांकि वे ज़बरदस्त हैं, लेकिन LLM को कई चुनौतियों का सामना करना पड़ता है, जिनमें कंप्यूटेशनल ज़रूरतें, नैतिक चिंताएँ और कॉन्टेक्स्ट को समझने में सीमाएँ शामिल हो सकती हैं।
