पिछले लेखों में हमने एआई के विज्ञान और दर्शन के पक्ष पर बात रखी थी। आम तौर पर लोग वैज्ञानिक खोज के व्यावहारिक इस्तेमाल को टेक्नॉलॉजी कह देते हैं। दरअसल बहुत सारी वैज्ञानिक जांच और खोज पहले से मौजूद टेक्नॉलॉजी की मदद से ही मुमकिन हो पाती है। एआई भी ऐसा एक क्षेत्र है जिसमें विज्ञान और टेक्नॉलॉजी परस्पर गड्ड-मड्ड हैं। टेक्नॉलॉजी महज तकनीक या औज़ार नहीं होती, बल्कि एक सांगठनिक खाके के साथ ही यह वजूद में आती है। और जैसा किसी भी टेक्नॉलॉजी के साथ होता है, जब यह सही तरीके से काम नहीं करती है तो भयंकर हादसे तक हो जाते हैं। टेक्नॉलॉजी जिस सामाजिक या सियासी खाके के साथ जुड़ी होती है, उसके निहित स्वार्थ तय करते हैं कि इसका फायदा किसे मिलेगा और नुकसान किसे होगा। एआई कुछ अलग नहीं है।
एआई के कई व्यावहारिक उपयोगों में एक यह है कि किसी तस्वीर में से चीज़ों की पहचान जल्द से जल्द कैसे की जाए। खास तौर पर किसी शख्स की पहचान करना आज एआई का आम इस्तेमाल बन गया है। दुनिया भर में सरकारें इस तकनीक का इस्तेमाल करती हैं। हमारे मुल्क में भी दिल्ली, बेंगलुरु जैसे बड़े हवाई अड्डों पर शक्ल की पहचान के कैमरे लगे हुए हैं, जिनके ज़रिए आप की तस्वीर कंप्यूटर में कैद हो जाती है। फिलहाल यह स्वैच्छिक तौर पर हो रहा है।
यह महज फोटो खींचने या वीडियो बनाने वाली बात नहीं है, जो सीसीटीवी (closed-circuit television) से होता है। जैसे हर शख्स का खास डीएनए होता है, या हाथ और उंगलियों की खास लकीरें होती हैं, वैसे ही चेहरे की खास पहचान होती है। शक्ल में हाड़-मांस-चमड़े के उतार-चढ़ाव को आकड़ों में दर्ज कर लिया जाता है। इसे मशीन विज़न सिस्टम कहा जाता है। आम नागरिकों को इससे कोई फर्क नहीं पड़ता। पर अपने विरोधियों पर नज़र रखने के लिए सरकारें इस टेक्नॉलॉजी का भरपूर इस्तेमाल कर रही हैं। अगर यह महज आतंकवादियों की पहचान करने तक सीमित होता, तो अच्छी बात होती। खतरनाक बात यह है कि अगर दर्ज सूचना में गलती रह जाए और इस वजह से किसी की गलत पहचान हो तो नतीजे भयंकर हो सकते हैं। इसकी एक मिसाल ड्रोन (चालक-रहित हवाई जहाज़) के जरिए बमबारी या मिसाइलें दागने का है।
सोचने पर लगता है कि शक्ल से पहचान के लिए इकट्ठा किए गए आंकड़ों में ज़्यादा कुछ तो होगा नहीं, आखिर आंखें, नाक, होंठ, यही तो हैं – या दाढ़ी-मूंछ है या नहीं, बस। पर असल में शक्ल में उतार-चढ़ाव की जटिलता कल्पना से भी ज़्यादा है। हम अक्सर किसी एक आदमी को देखकर किसी और के बारे में सोचने लगते हैं। कभी-कभी तो गलती से किसी को कोई और समझ बैठते हैं। यानी बात सिर्फ शक्ल को ज़हन में दर्ज करने की नहीं है, बाद में याददाश्त भी होनी चाहिए कि दर्ज की हुई पहचान किसकी थी। औसतन इंसान की शक्ल का फैलाव तकरीबन आधा फुट की भुजा के वर्ग के आकार का है, और साथ में तीसरा आयाम उतार-चढ़ाव का है। एक ग्राफ पेपर पर इसे दिखाया जा सकता है। अगर ग्राफ में सबसे छोटा वर्ग 1 वर्ग मि.मी. का है तो फैलाव को हम 150-150 यानी 22,500 वर्गों में बांट सकते हैं। हर छोटे वर्ग में रंगों की मदद से उतार-चढ़ाव दिखाया जा सकता है। अगर हम 16 रंगों का इस्तेमाल करें तो यह 22,500X16=3,60,000 आंकड़े हो गए। इसके बाद बात आती है चमड़े की बनावट या गठन की। हर बिंदु पर यह बदलती है। बढ़ती उम्र के साथ इसमें बदलाव आते हैं। लब्बोलुबाब यह कि शक्ल की पहचान जितना आसान मसला लगता है, उतना है नहीं। जितनी जटिलता होगी, उतने ही ज़्यादा आंकड़े होंगे और उनका हिसाब रख पाना उतना ही धीमा होगा। इसलिए शक्ल की पहचान में तकरीबन सही नतीजे पर पहुंचना हाल में ही मुमकिन हो पाया है। इसके लिए न्यूरल नेटवर्क और डीप लर्निंग का इस्तेमाल हो रहा है। इसे मुख्यत: चार चरणों में रखा जा सकता है – पहले चरण में शक्ल की तस्वीर लेकर उसे आंकड़ों में तबदील किया जाता है। जिस तरह हमारे दिमाग में किसी छवि को संजोए रखने के लिए उसे टुकड़ों में बांट कर अलग-अलग कोनों में जमा रखा जाता है, वैसे ही कंप्यूटर में भी छवि को अलग-अलग खासियतों में बांट कर दर्ज किया जाता है। दूसरे चरण में पूरी शक्ल को एक से दूसरी ओर तक ट्रैक करते हुए टुकड़ों में छोटे से छोटे हिस्से की तस्वीर ली जाती है। इसे पहले पूरी तस्वीर से दर्ज किए आंकड़ों के पूरक की तरह मान सकते हैं। तीसरे चरण में आंकड़ों को इस तरह बांटा जाता है (सेग्मेंटेशन – segmentation) ताकि बाद में उन्हें किसी मॉडल में शामिल करने में आसानी हो। मसलन अगर किसी कैनवस के हर हिस्से में अलग-अलग अनुपात में नीला और पीला रंग मिलाकर बिखेरा गया है, तो हमें अलग-अलग गहराई में बिखरे हरे रंग की तस्वीर दिखती है। हम इसे दो सूचियों में बांटकर आंकड़ों में दर्ज़ कर सकते हैं। एक सूची नीले रंग के और दूसरी पीले रंग के अनुपात को दर्ज़ करेगी। बाद में हम इसी अनुपात में दोनों रंग मिलाकर मूल तस्वीर फिर से बना सकते हैं। आखिरी चरण दर्ज आंकड़ों से मूल शक्ल को तैयार करने (रेस्टोरेशन – restoration) का है।
ऐसा लगता है कि शक्ल की पहचान इतना भी मुश्किल काम नहीं है। पर आज तक एआई के शोध में यह सबसे जटिल और चुनौतियों से भरी पहेलियों में से एक है। ऊपर बताए हर चरण में जटिलताएं हैं। मसलन ट्रैकिंग को ही लें। जब कैमरा ट्रैक कर रहा है, सांस लेने-छोड़ने जैसी कई वजहों से शक्ल में त्वचा का खिंचाव बदल सकता है। कैमरे में तस्वीर का बनना रोशनी पर निर्भर है। किस तरह का प्रकाश कहां से शक्ल पर पहुंच रहा है, उसमें कितना दूसरी चीज़ों से बिखर कर आ रहा है, ये बातें ली गई तस्वीर का मान तय करती हैं। इसलिए एक ही चीज़ पर दोहराई गई ट्रैकिंग में हर बार अलग आंकड़े दर्ज होते हैं। तीसरे और चौथे चरणों में आंकड़ों को संजोने और उनकी काट-छांट में कैसे नेटवर्क इस्तेमाल किए गए हैं, इससे आंकड़ों की प्रोसेसिंग पर असर पड़ता है। यानी मूल शक्ल को तैयार करने में गलत नतीजे मिलना मुमकिन है।
शक्ल की पहचान सिर्फ इंसान के लिए नहीं, बल्कि कई तरह के संदर्भों में अहम है। जैसे बिना ड्राइवर वाली गाड़ी के कैमरों में जो कुछ दर्ज होता रहता है, उसे पहले से दर्ज तस्वीरों के साथ तुलना कर हिसाब लगाया जाता है कि गाड़ी को आगे बढ़ाना है या नहीं, और यदि बढ़ाना है तो कितनी रफ्तार से और कैसी सावधानियों के साथ बढ़ाना है आदि। पश्चिमी मुल्कों में ऐसी गाड़ियों के टेस्ट-ड्राइव के दौरान एकाध हादसे हुए हैं, यानी मशीन द्वारा सामने आ रही चीजों की सही पहचान नहीं हो पाई थी।
कुदरती चीज़ों को कंप्यूटरों में दर्ज कर बाद में उसकी सही पहचान कर पाना इसलिए भी मुश्किल है कि कुदरत में बहुत सारी बातें संजोग से होती हैं। एक गाड़ी के सामने पड़ा हुआ छोटा बेजान पत्थर कभी अचानक उछल सकता है, क्योंकि कहीं और से कुछ आ टकराए या पत्थर के अंदर किसी छेद में कुछ फूट पड़े – ऐसी कई बातें अचानक घट सकती हैं, जिनका हिसाब पहले से नहीं रखा जा सकता है। इसलिए न्यूरल नेटवर्क की गणनाओं में संभाविता के आधार पर बदलाव किए जाते हैं। एआई के शोध में यह भी एक चुनौतियों भरा काम है, क्योंकि संजोग को गणना में शामिल करने का मतलब अक्सर यह होता है कि आंकड़ों के कई समूह इकट्ठे किए जाएं और उनका सांख्यिकी के कायदों (जैसे औसत मान आदि) का इस्तेमाल कर विश्लेषण किया जाए। इससे आंकड़ों की तादाद कई गुना बढ़ जाती है। दूसरे गणितीय तरीकों को भी अपनाया जाता है, पर ऐसी हर कोशिश नई चुनौतियां पेश करती है।
कोई भी टेक्नॉलॉजी संदर्भ-निरपेक्ष नहीं होती है। इसलिए हर टेक्नॉलॉजी के विकास में ज़्यादा से ज़्यादा लोगों की भागीदारी होनी चाहिए ताकि लोग अपने भले-बुरे का फैसला कर सकें और विकास को सही दिशा दे सकें। एआई के गलत इस्तेमाल से अक्सर बड़ी तबाही हुई है। शक्ल की पहचान से आम जनता को एक दायरे में बांधे रखना लोकतांत्रिक मूल्यों के खिलाफ जाता है। आज जो जंग लड़ी जाती हैं, उनमें पहले की जंगों जैसी आमने-सामने की मुठभेड़ नहीं होती। आज धरती के एक छोर से उड़कर ड्रोन दूसरे छोर तक पहुंचते हैं। उनमें लगे कैमरों से तस्वीरें पल भर में वापस कंट्रोल-रूम तक भेजी जाती हैं, जहां फटाफट कंप्यूटरों में एआई द्वारा बमबारी का निशाना तय कर लिया जाता है और मिसाइल दाग दी जाती है। जाहिर है, मिसाइल चलाने वालों और टार्गेट के बीच न सिर्फ बहुत बड़ी भौगोलिक, बल्कि विशाल मनोवैज्ञानिक दूरी होती है। पिछले दशक में किसी ज़मीनी जंग में शामिल एक फौजी से भी ज़्यादा हत्याएं ड्रोन और मिसाइल चलाने वाले आभासी पायलटों ने की हैं। अक्सर इनमें फौजी टार्गेट की जगह आम नागरिक मारे जाते हैं। हाल में अफगानिस्तान में अमेरिकी ड्रोन द्वारा गलत निशाना तय होने की वजह से एक दर्जन से ज़्यादा आम नागरिक मारे गए थे। आम तौर पर ऐसे ड्रोन चलाने वाले भी घोर मानसिक तकलीफों से गुज़रते हैं। कई तो काम छोड़कर जंगलों में जा छिपते हैं, क्योंकि निर्दोष नागरिकों की, जिनमें अक्सर बच्चे भी होते हैं, हत्या का बोझ मनोवैज्ञानिक नासूर बनकर उन्हें ताज़िंदगी कचोटता है।
ऐसी तमाम बातें दुनिया भर में लोकतांत्रिक सोच रखने वाले लोगों को परेशान करती रही हैं। एआई की तड़क-भड़क और शोर मोहक है, पर इसके नुकसान भी कम नहीं हैं। इस बारे में सचेत रहना हरेक नागरिक की ज़िम्मेदारी है। (स्रोत फीचर्स)
नोट: स्रोत में छपे लेखों के विचार लेखकों के हैं। एकलव्य का इनसे सहमत होना आवश्यक नहीं है।
Photo Credit : https://shooliniuniversity.com/blog/wp-content/uploads/2021/08/artificial-intelligence-shoolini-university-best-himachal-pradesh-university.jpg