सन्दर्भ:
: हाल ही में, Google DeepMind ने Genie AI Model नामक एक नया मॉडल पेश किया है जो केवल एक टेक्स्ट या छवि प्रॉम्प्ट से इंटरैक्टिव वीडियो गेम उत्पन्न कर सकता है।
Genie AI Model के बारे में:
: यह एक फाउंडेशन वर्ल्ड मॉडल है जिसे इंटरनेट से प्राप्त वीडियो पर प्रशिक्षित किया जाता है।
: मॉडल “सिंथेटिक छवियों, तस्वीरों और यहां तक कि रेखाचित्रों से खेलने योग्य (क्रिया-नियंत्रित) दुनिया की एक अंतहीन विविधता उत्पन्न कर सकता है।”
: यह पहला जेनरेटिव इंटरैक्टिव वातावरण है जिसे बिना लेबल वाले इंटरनेट वीडियो से बिना पर्यवेक्षित तरीके से प्रशिक्षित किया गया है।
: विशिष्टताएँ- आकार के संबंध में, Genie 11बी मापदंडों पर मौजूद है और इसमें एक स्पेटियोटेम्पोरल वीडियो टोकननाइज़र, एक ऑटोरेग्रेसिव डायनेमिक्स मॉडल और एक सरल और स्केलेबल अव्यक्त एक्शन मॉडल शामिल है।
: ये तकनीकी विशिष्टताएं जिन्न को प्रशिक्षण, लेबल या किसी अन्य डोमेन-विशिष्ट आवश्यकताओं के बिना भी फ्रेम-दर-फ्रेम आधार पर उत्पन्न वातावरण में कार्य करने देती हैं।
: Genie को इंटरैक्टिव और नियंत्रणीय वातावरण का एक विविध सेट उत्पन्न करने के लिए प्रेरित किया जा सकता है, हालांकि इसे केवल-वीडियो डेटा पर प्रशिक्षित किया जाता है।
: यह एकल छवि प्रॉम्प्ट से खेलने योग्य वातावरण बनाता है।
: इसे उन छवियों के साथ संकेत दिया जा सकता है जिन्हें उसने कभी नहीं देखा है।
: इसमें वास्तविक दुनिया की तस्वीरें और रेखाचित्र शामिल हैं, जो लोगों को उनकी काल्पनिक आभासी दुनिया के साथ बातचीत करने की अनुमति देते हैं।
: इसे 2D प्लेटफ़ॉर्मर गेम और रोबोटिक्स के वीडियो पर अधिक प्रशिक्षित किया जाता है।
: जिनी को एक सामान्य विधि पर प्रशिक्षित किया जाता है, जो इसे किसी भी प्रकार के डोमेन पर कार्य करने की अनुमति देता है, और यह बड़े इंटरनेट डेटासेट के लिए भी स्केलेबल है।
: Genie का असाधारण पहलू विशेष रूप से इंटरनेट वीडियो से इन-गेम पात्रों के लिए नियंत्रण सीखने और पुन: पेश करने की क्षमता है।
: यह उल्लेखनीय है क्योंकि इंटरनेट वीडियो में वीडियो में की जाने वाली क्रिया के बारे में लेबल नहीं होता है, या यहां तक कि छवि के किस हिस्से को नियंत्रित किया जाना चाहिए।
: यह आपको एक ही छवि से एक पूरी तरह से नया इंटरैक्टिव वातावरण बनाने की अनुमति देता है।