कृत्रिम बुद्धि बता देगी कि आपने क्या देखा था

कृत्रिम बुद्धि (एआई) का एक नया करिश्मा सामने आया है और यह बहुत हैरतअंगेज़ है। इस बार एआई ने व्यक्ति के ब्रेन स्कैन का विश्लेषण करके इस बात का खुलासा कर दिया कि उस व्यक्ति ने क्या देखा था। एकदम साफ चित्र तो नहीं बना लेकिन मोटा-मोटा खाका तो सामने आ ही गया।

एक ओर तो तंत्रिका वैज्ञानिक यह समझने की जद्दोजहद में हैं कि हमारी आंखों से जो इनपुट प्राप्त होता है, उसे दिमाग मानसिक छवियों का रूप कैसे देता है, वहीं एआई ने दिमाग की इस काबिलियत की नकल कर ली है। हाल ही में एक कंप्यूटर दृष्टि सम्मेलन में यह बताया गया कि ब्रेन स्कैन को देखकर एआई उस छवि का काफी यथार्थ चित्रण कर देती है जो उस व्यक्ति ने हाल में देखी थी।

दिमाग में बनी तस्वीर को पढ़ने का यह करिश्मा एआई की एक एल्गोरिद्म की मदद से किया गया – स्टेबल डिफ्यूज़न। इस एल्गोरिद्म का विकास जर्मनी के एक दल ने 2022 में जारी किया था। स्टेबल डिफ्यूज़न दरअसल पूर्व में विकसित DALL-E 2 और Midjourney जैसे कुछ एल्गोरिद्म के समान है लेकिन वे एल्गोरिद्म किसी पाठ्य वस्तु द्वारा दिए गए उद्दीपन के आधार पर तस्वीर बनाते हैं। इन्हें पाठ्य वस्तुओं से जुड़ी करोड़ों तस्वीरों की मदद से ऐसा करने के लिए प्रशिक्षित किया जाता है।

ताज़ा अध्ययन के लिए जापान के एक दल ने स्टेबल डिफ्यूज़न के मानक प्रशिक्षण में कुछ आयाम और जोड़े। इनमें खास तौर से ब्रेन स्कैन के दौरान व्यक्ति को दिखाए चित्र के ब्रेन स्कैन में दिख रहे पैटर्न को लेकर विवरण शामिल किए गए थे। यानी व्यक्ति को कोई चित्र दिखाया, ब्रेन स्कैन में उसका पैटर्न देखा और उस पैटर्न को चित्र से जोड़कर विवरण बनाया और यह सारी जानकारी कंप्यूटर में डाल दी।

इसके बाद एल्गोरिद्म इस जानकारी का उपयोग चित्रों के प्रोसेसिंग में शामिल दिमाग के विभिन्न हिस्सों (जैसे ऑक्सीपीटल व टेम्पोरल लोब्स) से प्राप्त जानकारी को जोड़कर तस्वीर का निर्माण करता है। ओसाका विश्वविद्यालय के यू तगाकी का कहना है कि यह एल्गोरिद्म फंक्शनल एमआरआई (fMRI) से प्राप्त ब्रेन स्कैन की जानकारी की व्याख्या करता है। यह रिकॉर्ड करता है कि किसी भी क्षण दिमाग के विभिन्न हिस्सों में रक्त के प्रवाह में किस तरह के परिवर्तन हो रहे हैं, जिसके आधार पर यह पता चलता है कि कौन से हिस्से सक्रिय हैं।

जब व्यक्ति फोटो देखता है तो टेम्पोरल लोब मूलत: तस्वीर की विषयवस्तु (व्यक्ति, वस्तु अथवा सीनरी) पर ध्यान देता है जबकि ऑक्सीपीटल लोब उसके विन्यास और परिप्रेक्ष्य (जैसे वस्तुओं की साइज़ और स्थिति) रिकॉर्ड करता है। यह सारी जानकारी fMRI में दिमाग के हिस्सों की सक्रियता के रूप में रिकॉर्ड हो जाती है। इसी जानकारी का उपयोग एआई द्वारा करके तस्वीर को पुन: निर्मित किया जाता है।

इस अध्ययन में जानकारी का एक स्रोत यह था कि मिनेसोटा विश्वविद्यालय में 4 व्यक्तियों के ब्रेन स्कैन की सूचना थी जो प्रत्येक व्यक्ति द्वारा 10,000 फोटो देखते हुए लिए गए थे। इनमें से प्रत्येक के कुछ ब्रेन स्कैन्स का उपयोग एल्गोरिद्म के प्रशिक्षण में नहीं किया गया था, लेकिन उनका उपयोग एल्गोरिद्म की जांच में किया गया।

एआई द्वारा जनित प्रत्येक तस्वीर शोरगुल के रूप में शुरू होती है जैसा टीवी पर भी देखा जाता है। फिर धीरे-धीरे जब स्टेबल डिफ्यूज़न व्यक्ति की दिमागी सक्रियता की जानकारी की तुलना उसे प्रशिक्षण के दौरान दिखाई गई तस्वीरों से करता है, तो कुछ पैटर्न उभरने लगते हैं। अंतत: एक तस्वीर उभर आती है। इसमें विषयवस्तु, चीज़ों की जमावट, और परिप्रेक्ष्य काफी अच्छे से नज़र आते हैं।

शोधकर्ताओं ने पाया कि मूलत: ऑक्सीपीटल लोब में सक्रियता से विन्यास और परिप्रेक्ष्य सम्बंधी जानकारी तो पर्याप्त थी लेकिन वस्तुओं को पहचानने के लिए पर्याप्त जानकारी नहीं थी। लिहाज़ा जहां घंटाघर था, वहां एल्गोरिद्म ने एक अमूर्त सा चित्र बना दिया। बहरहाल, शोधकर्ताओं का मत है कि प्रशिक्षण के लिए ज़्यादा डैटा का उपयोग करने से ये बारीकियां भी पकड़ी जा सकेंगी। फिलहाल शोधकर्ताओं ने इस समस्या से निपटने के लिए प्रशिक्षण के लिए प्रयुक्त छवियों के साथ नाम भी चस्पा कर दिए हैं। (स्रोत फीचर्स)

नोट: स्रोत में छपे लेखों के विचार लेखकों के हैं। एकलव्य का इनसे सहमत होना आवश्यक नहीं है।
Photo Credit : https://imgv3.fotor.com/images/blog-richtext-image/AI%E9%82%AE%E4%BB%B6%E5%9B%BE.png

प्रातिक्रिया दे जवाब रद्द करें