नई दिल्ली. 08 दिसंबर। गूगल ने एक एआई न्यूरल नेटवर्क जेमिनी एआई टूल लॉन्च किया है. न्यूरल नेटवर्क को इंसान में न्यूरॉन्स की तरह समझा जा सकता है जो संदेश को एक जगह से दूसरी जगह ले जाने का काम करते हैं. सबसे प्रसिद्ध न्यूरल नेटवर्क का उदाहरण गूगल का सर्च इंजन है. इसी तरह जेमिनी एआई भी एक न्यूरल नेटवर्क है जिसे टेक्सट और कोड के बहुत बड़े डेटासेट के लिए ट्रेन किया गया है.
इस डेटा सेट में किताबें, आर्टिकल्स, कोड्स व अन्य कई लिखित सामग्रियां शामिल हैं. जेमिनी एआई शब्द और वाक्यों के बीच पैटर्न और संबंध को सीखने में सक्षम है. इसलिए जेमिनी, भाषा का अनुवाद, टेक्स्ट लिखना, सवालों का जवाब अधिक विस्तार से देना और क्रिएटिव कंटेट तैयार करना आदि आसानी से कर सकता है. हालांकि, ये काम बाकी न्यूरल नेटवर्क भी कमोबेश कर सकते हैं तो जेमिनी में क्या खास है.
इसकी सबसे बड़ी खास बात ये है कि ये ना सिर्फ टेक्स्ट को समझता है बल्कि तस्वीरों, वीडियो और ऑडियो को भी समझता है. यह मैथ्य, फिजिक्स व अन्य जटिल विषयों की समझ रखता है और उन्हें हल करने में मदद करता है. यह प्रोग्रामिंग लैग्वैंज के लिए हाई क्वॉलिटी कोड जेनरेट कर सकता है. यह तस्वीर को इनपुट की तरह लेकर फोटो में मौजूद सामग्री से संबंधित आइडिया आपको दे सकता है. अगर आप इसे वीडियो दिखाते हैं तो यह उसका कोड जेनरेट कर सकता है.
अभी कहां मिलेगा
फिलहाल इसे केवल 2 सेवाओं के लिए लॉन्च किया गया है. आप गूगल पिक्सल 8 और गूगल बार्ड में जेमिनी का इस्तेमाल कर सकते हैं. हालांकि, इसे धीरे-धीरे गूगल की अन्य सेवाओं के लिए भी लॉन्च किया जाएगा. इसे सर्च, ऐड, क्रोम और दूसरी सर्विसेज के साथ भी इंटिग्रेट किया जाएगा. जेमिनी के तीन वर्जन हैं.
जेमिनी एक मल्टीमॉडल एआई है जबकि मौजूदा एआई मॉडल, जैसे चैटजीपीटी, यह काम नहीं कर पाता है. मसलन, चैटजीपीटी अभी केवल टेक्स्ट को समझ कर उस पर प्रतिक्रिया दे सकता है. वहीं, जेमिनी टेक्स्ट के साथ इमेज, ऑडियो और वीडियो को भी इनपुट की तरह लेकर उस पर प्रतिक्रिया दे सकता है. जेमिनी की साइट पर गूगल ने दावा किया है कि मैसिव मल्टीटास्किंग लैंगुवेज अंडरस्टैंडिंग के मामले में जेमिनी ने इंसानी विशेषज्ञता को भी पछाड़ दिया है.