सन्दर्भ:
: हाल ही में, माइक्रोसॉफ्ट ने अपने ‘लाइटवेट’ एआई मॉडल – फी-3-मिनी (Phi-3-mini) के नवीनतम संस्करण का अनावरण किया।
Phi-3-mini के बारे में:
: ऐसा माना जाता है कि यह उन तीन छोटे मॉडलों में से पहला है जिन्हें माइक्रोसॉफ्ट जारी करने की योजना बना रहा है।
: कथित तौर पर इसने भाषा, तर्क, कोडिंग और गणित जैसे क्षेत्रों में विभिन्न बेंचमार्क में समान आकार और अगले आकार के मॉडल से बेहतर प्रदर्शन किया है।
: यह अपनी श्रेणी का पहला मॉडल है जो गुणवत्ता पर बहुत कम प्रभाव के साथ 128K टोकन तक की संदर्भ विंडो का समर्थन करता है।
: किसी भी समय एआई द्वारा पढ़ी और लिखी जा सकने वाली बातचीत की मात्रा को संदर्भ विंडो कहा जाता है, और इसे टोकन में मापा जाता है।
: यह एक 3.8B भाषा मॉडल है और Microsoft Azure AI Studio, HuggingFace और Ollama जैसे AI विकास प्लेटफार्मों पर उपलब्ध है।
: Phi-3-mini दो वेरिएंट में उपलब्ध है, एक 4K संदर्भ-लंबाई के साथ, और दूसरा 128K टोकन के साथ।
Phi-3-mini बड़े भाषा मॉडल (LLM) से किस प्रकार भिन्न है?
: Phi-3-mini एक लघु भाषा मॉडल (SLM) है।
: SLM बड़े भाषा मॉडल के अधिक सुव्यवस्थित संस्करण हैं।
: LLM की तुलना में, छोटे एआई मॉडल विकसित करने और संचालित करने के लिए भी लागत प्रभावी हैं, और वे लैपटॉप और स्मार्टफोन जैसे छोटे उपकरणों पर बेहतर प्रदर्शन करते हैं।
: SLM ऑन-डिवाइस और ऑफ़लाइन अनुमान परिदृश्यों सहित संसाधन-बाधित वातावरण के लिए बहुत अच्छे हैं और ऐसे मॉडल उन परिदृश्यों के लिए अच्छे हैं जहां तेज़ प्रतिक्रिया समय महत्वपूर्ण है, जैसे कि चैटबॉट या वर्चुअल असिस्टेंट के लिए।
: SLM को विशिष्ट कार्यों के लिए अनुकूलित किया जा सकता है और उन्हें करने में सटीकता और दक्षता प्राप्त की जा सकती है।
: अधिकांश SLM लक्षित प्रशिक्षण से गुजरते हैं, जो LLM की तुलना में काफी कम कंप्यूटिंग शक्ति और ऊर्जा की मांग करते हैं।
: जब अनुमान गति और विलंबता की बात आती है तो एसएलएम भी भिन्न होते हैं।
: उनका कॉम्पैक्ट आकार त्वरित प्रसंस्करण की अनुमति देता है।
: उनकी लागत उन्हें छोटे संगठनों और अनुसंधान समूहों के लिए आकर्षक बनाती है।