20/07/2023
مصنوعی ذہانت کو سمجھنے کے لیے آسان گائیڈ
کیا آپ نے اب تک مصنوعی ذہانت کے بارے میں سوچا ہے؟
گذشتہ چھ ماہ کے دوران چیٹ جی پی ٹی جیسے چیٹ باٹس اور مڈجرنی جیسے امیج جنریٹرز بڑی تیزی سے ایک سماجی حقیقت بن گئے ہیں۔
مگر آرٹیفیشل انٹیلیجنس، مصنوعی ذہانت، (AI) یا ’مشین لرننگ‘ کے ماڈل کافی عرصے سے موجود رہے ہیں۔
اس گائیڈ میں ہم چیٹ بوٹس سے آگے بڑھ کر مصنوعی ذہانت کی مختلف اقسام کا جائزہ لیں گے اور دیکھیں گے کہ ہماری زندگی میں اس کا کیا کردار ہے
اے آئی خود بخود کیسے سب سیکھ جاتی ہے؟
مشین لرننگ کا اہم مرحلہ ٹریننگ کہلاتا ہے جس میں ایک کمپیوٹر پروگرام کو بڑی تعداد میں ڈیٹا فراہم کیا جاتا ہے۔ ساتھ ہی اس میں ایسی معلومات شامل کی جاتی ہیں تاکہ اسے معلوم ہوسکے کہ یہ ڈیٹا کیا ہے۔ اس کے ساتھ اس پروگرام کو مختلف ہدایات دی جاتی ہیں۔
یہ ہدایات کچھ ایسی ہوسکتی ہیں کہ: ’تمام وہ تصاویر ڈھونڈیں جن میں چہرے ہیں‘ یا ’ان آوازوں کی درجہ بندی کریں‘۔
یہ پروگرام پھر ڈیٹا کے اندر ایسے نمونے تلاش کرتا ہے اور آپ کے دیے گئے اہداف حاصل کرتا ہے۔
اس عمل کے دوران پروگرام کو وقتاً فوقتاً مدد درکار ہوتی ہے، جیسے ’یہ کوئی چہرہ نہیں‘ یا ’یہ دو آوازیں ایک دوسرے سے مختلف ہیں‘۔ لیکن کمپیوٹر پروگرام جو کچھ ڈیٹا اور دیے گئے سراغوں کی مدد سے سیکھتا ہے وہ اے آئی کا ماڈل بن جاتا ہے اور ٹریننگ یا تربیتی مواد اس ماڈل کی صلاحیتوں کا تعین کرتا ہے۔
تربیتی عمل مختلف اقسام کے اے آئی کیسے بنا سکتا ہے، اسے سمجھنے کے لیے آپ مختلف جانوروں کو تصور کر سکتے ہیں۔
لاکھوں برسوں کے دوران قدرتی ماحول میں مختلف جانوروں میں مخصوص صلاحیتیں پیدا ہوئیں۔ اسی طرح جب اے آئی تربیتی ڈیٹا کو لاکھوں بار پرکھتا ہے تو اس میں خاص صلاحیتیں پیدا ہوتی ہیں جس سے مخصوص کاموں کے لیے اے آئی ماڈل بنتے ہیں۔
کیا ایسی کوئی مثالیں ہیں کہ ہم نے اے آئی کو تربیت دے کر اس میں مختلف صلاحیتیں پیدا کیں؟
چیٹ باٹس کیا ہیں؟
ایک لمحے کے لیے آپ کسی چیٹ باٹ کو ایک طوطا تصور کریں۔ یہ بات دہراتا ہے اور وہی الفاظ بولتا ہے جو اس نے کسی سیاق و سابق میں سن رکھے ہوں۔ لیکن اسے ان الفاظ کے صحیح معنی معلوم نہیں ہوتے۔
چیٹ باٹس بھی ایسا ہی کرتے ہیں مگر بہت بہتر طریقے سے اور یہ لکھے ہوئے لفظوں کے ساتھ ہمارے تعلق کو تبدیل کرنے کے دہانے پر ہیں۔
مگر چیٹ باٹس کو کچھ بھی لکھنا کیسے آتا ہے؟
یہ اے آئی کی ایک قسم ہے جسے لارج لینگویج ماڈلز (ایل ایل ایمز) کہتے ہیں اور انھیں بڑی تعداد میں تحریری مواد کے ذریعے تربیت دی گئی ہے۔
ایل ایل ایم صرف انفرادی لفظ کو ہی نہیں دیکھتا بلکہ پورے جملے کا جائزہ لیتا ہے۔ یہ اپنے تربیتی ڈیٹا میں کسی لفظ اور جملے کا موازنہ ملتی جلتی تحاریر سے کرتا ہے۔
الفاظ اور اصطلاحات میں اربوں مرتبہ موازنوں کی مدد سے یہ کوئی سوال پڑھ سکتا ہے اور اس کا جواب تیار کر سکتا ہے۔ یہ موبائل فون پر پریڈکٹو ٹیکسٹ مسیجنگ جیسا ہے، لیکن بہت بڑے پیمانے پر۔
لارج لینگویج ماڈل کی زبردست بات یہ ہے کہ یہ گرامر (قواعد زبان) سیکھ جاتا ہے اور خود بخود لفظوں کا مطلب سمجھ جاتا ہے، بغیر انسانوں کی مدد کے۔
کیا میں اے آئی سے ساتھ بات چیت کر سکتا ہوں؟
اگر آپ نے الیگزا، سِری یا اس جیسا کوئی بھی آواز کی پہچان کرنے والا نظام استعمال کیا ہے تو آپ مصنوعی ذہانت کا ہی استعمال کر رہے تھے۔
فرض کریں کہ ایک بڑے کانوں والے خرگوش کو یہ تربیت دی جاتی ہے کہ وہ آواز میں ہلکی سی تبدیلی بھی بھانپ لے۔
اے آئی اس وقت آواز ریکارڈ کرتا ہے جب آپ بولتے ہیں، یہ پس منظر کے شور کو حذف کر دیتا ہے، آپ کی باتوں کو فونیٹک یونٹس (انفرادی آوازیں جو لفظ بناتی ہیں) میں تبدیل کر دیتا ہے اور پھر اس کا موازنہ اپنی لائبریری میں موجود لینگویج ساؤنڈز سے کرتا ہے۔
آپ کی باتوں کو پھر تحریر میں تبدیل کیا جاتا ہے جہاں سننے میں کسی غلطی کے امکان کی تصحیح کی جاتی ہے اور اس کے ساتھ آپ کے سوال کا جواب دیا جاتا ہے۔
اس قسم کی مصنوعی ذہانت کو نیچرل لینگویج پراسیسنگ کہتے ہیں، یعنی قدرتی انداز میں کسی زبان کو سمجھنا۔
یہ وہ ٹیکنالوجی ہے جو فون بینکنگ کے عمل میں کسی ادائیگی کرنے کی تصدیق سے فون سے شہر کا موسم دریافت کرنے تک سب چیزوں کے پیچھے کارفرما ہے
کیا اے آئی تصاویر کو سمجھ سکتی ہے؟
کیا آپ کے سمارٹ فون نے کبھی آپ کی تصاویر کی ان ناموں سے درجہ بندی کی ہے جیسے ’ساحل سمندر پر‘ یا ’رات کی پارٹی‘؟
آپ کو اس کا علم نہیں مگر آپ کا فون پہلے ہی مصنوعی ذہانت کا استعمال کر رہا ہے۔ اے آئی کے ایک الگوردم نے آپ کی تصاویر میں مخصوص نمونوں یا رجحانات کی نشاندہی کی اور انھیں ایک ساتھ ایک فولڈر میں ڈال دیا۔
اس کمپیوٹر پروگرام کی ٹریننگ کے لیے اسے لاکھوں تصاویر دکھائی گئیں جنھیں آسان لفظوں میں بیان کیا گیا تھا۔
اگر آپ کسی امیج ریکیگنیشن اے آئی کو ’سائیکل‘ کے نام کی تصاویر دیں تو یہ سمجھ جائے گا کہ سائیکل کیسی نظر آتی ہے اور یہ کیسے کسی کشتی یا گاڑی سے مختلف ہوتی ہے۔
بعض اوقات اے آئی کو یہ تربیت دی جاتی ہے کہ ایک جیسی نظر آنے والی تصاویر میں باریکی سے فرق تلاش کیا جائے۔
فیشل ریکیگنشین یعنی چہروں کی نشاندہی کا پروگرام اسی طرح کام کرتا ہے۔ یہ آپ کے چہرے میں مخصوص اور الگ فیچرز کو ڈھونڈتا ہے، جو کسی دوسرے چہرے میں نہیں ہیں۔
میڈیکل سکینز کے ذریعے بھی ایسے الگوردم ترتیب دیے گئے ہیں جو جان لیوا ٹیومر تلاش کر سکتے ہیں اور ایک وقت میں ہزاروں سکینز پر کام کر سکتے ہیں۔ اس دورانیے میں کوئی ماہر ڈاکٹر صرف کسی ایک کیس میں فیصلہ کر پائے۔
اے آئی نئی تصاویر کیسے بناتی ہے؟
حال ہی میں امیج ریکگنیشن کی ٹیکنالوجی کو تربیت دے کر ایسے اے آئی ماڈل میں تبدیل کیا گیا ہے جن میں کسی گرگٹ کی طرح رنگ اور حلیے کے ساتھ کھیلنے کی صلاحیت ہے۔
امیج جنریٹنگ اے آئی لاکھوں تصاویر اور ڈرائنگز سے حاصل کردہ پیچیدہ ویژیول پیٹرن کو نئی تصاویر میں بدل سکتے ہیں۔
آپ اے آئی سے ایسی تصاویر مانگ سکتے ہیں جن کا کوئی وجود ہی نہیں، مثلاً آپ اس سے مریخ کی سطح پر چلتے انسان کی تصویر مانگ سکتے ہیں۔
یا پھر آپ اس سے اختراعی انداز کی تصویر مانگ سکتے ہیں جیسے’انگلینڈ کے ایک فٹبال مینیجر کی تصویر جسے پکاسو کے انداز میں پینٹ کیا گیا ہو۔‘
نئی تصویر بنانے کا عمل بےترتیب انداز میں جمع کیے گئے رنگ برنگے پکسلز (چھوٹے نقطے جن کے ملنے سے ایک تصویر بنتی ہے) سے شروع ہوتا ہے۔
جدید اے آئی اپنی تربیت کے دوران یہ سیکھتا ہے کہ کیسے بےترتیب نقطوں میں پیٹرن تلاش کرنا ہے۔ اس کی مدد سے یہ محتلف چیزیں بنا سکتا ہے۔
آہستہ آہستہ اس نمونے میں کام کی مزید تہیں شامل کر کے اسے بہتر کیا جاتا ہے۔ ان نقطوں کو برقرار رکھا جاتا ہے جو پیٹرن بنائیں اور باقیوں کو حذف کر دیا جاتا ہے۔ یہ عمل تب تک جاری رہتا ہے جب تک سوال کے جواب میں مشابہت نظر نہ آئے۔
تمام ضروری اجزا جیسے ’مریخ کی سطح‘، ’خلا باز‘ اور ’چہل قدمی‘ کے پیٹرن بننے پر ایک نئی تصویر جنم لیتی ہے۔
یہ نئی تصویر بےترتیب پکسلز کی تہوں سے بنتی ہے اس لیے اے آئی کا جواب وہ تصویر ہوتی ہے جس کا پہلے کوئی وجود نہیں ہوتا لیکن اس کی بنیاد تربیت کے دوران فراہم کردہ تصاویر اور ان کے اربوں نمونے ہوتے ہیں۔
معاشرے میں اب اس تصور کے بارے میں سوچا جا رہا ہے کہ اس کا کاپی رائٹ اور ایسے اختراعی فن پاروں سے جڑی اخلاقیات کے تناظر میں کیا مطلب ہوگا جو کہ اصل فنکاروں، ڈیزائنرز اور فوٹو گرافرز کی سخت محنت کا نتیجہ ہوتے ہیں۔
سیلف ڈرائیونگ گاڑیوں کے بارے میں ہم کیا جانتے ہیں؟
سیلف ڈرائیونگ یا خودکار گاڑیاں کئی دہائیوں سے اے آئی کی بحث کا حصہ رہی ہیں اور سائنس فکشن نے انھیں ہمارے خیالات کا حصہ بنا دیا ہے۔
سیلف ڈرائیونگ اے آئی کو خودمختار ڈرائیونگ بھی کہتے ہیں۔ اس میں گاڑیوں میں کیمرے، ریڈار اور رینج سینسنگ لیزر نصب کیے جاتے ہیں۔
آپ ایک ڈریگن فلائی یا بھنبھیری کو تصور کریں جس میں 360 ڈگری کا ویژن اور سینسرز نصب کیے گئے ہیں تاکہ اس کی اڑان کو کنٹرول کیا جائے اور اس کی پرواز میں بہتری کے لیے دورانِ پرواز مسلسل چھوٹی موٹی تبدیلیاں کی جائیں۔
اسی طرح اے آئی ماڈل سینسرز سے حاصل ہونے والے ڈیٹا کو استعمال کر کے چیزوں کی نشاندہی کرتا ہے اور یہ تعین کرتا ہے کہ آیا وہ حرکت میں ہیں۔ یہ بھی دیکھا جاتا ہے کہ متحرک چیز کیا ہے، یعنی یہ کوئی کار، سائیکل، پیدل مسافر یا کچھ اور ہے۔
اے آئی کو لاکھوں گھنٹوں تک یہ تربیت دی گئی ہے کہ اچھی ڈرائیونگ کیسی ہوتی ہے اور اس سے یہ اس قابل ہوا ہے کہ اصل دنیا میں کار چلا سکے اور حادثوں سے بچ سکے۔
کئی سال تک پیشگوئی کرنے والے ایلگوردم مشکلات سے دوچار رہے ہیں کیونکہ انسانوں کی ڈرائیونگ کے حوالے سے پیشگوئی کرنا قدرتی طور پر ناممکن ہے۔
خودمختار ڈرائیونگ ایک ایسی عوامی سطح کی مثال ہے کہ کیسے نئی ٹیکنالوجی کو تکنیکی رکاوٹوں کے علاوہ دیگر مشکلات کا بھی سامنا کرنا پڑتا ہے۔
حکومتی قانون سازی اور حفاظتی اصولوں کے ساتھ ساتھ اس بارے میں بھی تشویش پائی جاتی ہے کہ اگر ہر چیز مشینیں کنٹرول کریں گی تو کیا ہو گا؟ ایک مکمل آٹومیٹڈ مستقبل کی راہ میں یہ ممکنہ رکاوٹیں ہیں۔
بعض اے آئی صرف اعداد پر کام کرتے ہیں، انھیں جمع کرتے ہیں اور انھیں وسیع پیمانے پر جوڑ کر معلومات حاصل کرتے ہیں۔ اس کا نتیجہ بہت کارآمد ہوسکتا ہے۔
مالی اور سماجی سطح پر آپ نے کئی اقدام کیے ہوں گے، خاص کر آن لائن۔ ان کی مدد سے آپ کے رویے کے حوالے سے پیشگوئی کی جاسکتی ہے۔
آپ کا سپر مارکیٹ لائلٹی کارڈ آپ کی عادتوں پر نظر رکھتا ہے اور ہفتہ وار شاپنگ کو دیکھتا ہے۔ کریڈٹ ایجنسیاں یہ بتاتی ہیں کہ آپ کے پاس بینک میں کتنے پیسے ہیں اور کریڈٹ کارڈ پر کتنا قرض ہے۔
نیٹ فلکس اور ایمیزون یہ بتاتے ہیں کہ گذشتہ رات آپ نے کتنے گھنٹوں تک فلمیں اور ڈرامے دیکھے۔ سوشل میڈیا اکاؤنٹس کو معلوم ہے کہ آپ نے آج کتنی ویڈیوز پر تبصرہ کیا۔
یہ سب صرف آپ تک محدود نہیں۔ ہر کسی کے بارے میں یہ اعدادوشمار موجود ہیں۔ اے آئی ماڈل انھیں دیکھ کر ہی سوشل ٹرینڈز کی نشاندہی کرتا ہے۔
اے آئی ماڈل ابھی سے آپ کی زندگیوں پر اثرانداز ہو رہے ہیں۔ یہ آپ کو بتاتے ہیں کہ آپ کو ادھار لینا چاہیے یا قرضے پر گھر لینا چاہیے۔ یہ آپ کو آن لائن اشتہارات کے ذریعے بتاتا ہے کہ آپ کو کیا خریدنا ہے۔
اے ئی اپنے بل بوتے پر کیسے سیکھ سکتا ہے؟
زیر نگرانی سیکھنے کا عمل ایک ناقابل یقین حد تک طاقتور تربیتی طریقہ ہے، لیکن مصنوعی ذہانت کے میدان میں بہت سی حالیہ کامیابیاں بغیر کسی نگرانی کے سیکھنے سے ممکن ہوئی ہیں۔
آسان لفظوں میں اس سے مراد پیچیدہ ایلگوردم اور بڑی تعداد میں ڈیٹا کا استعمال ہے جس کے ذریعے اے آئی انسانی نگرانی کے بغیر بھی سیکھ سکتا ہے۔
چیٹ جی پی ٹی اس کی جانی مانی مثال ہے۔
انٹرنیٹ پر تصنیفات اور ڈیجیٹل کتابوں کا متن اتنا زیادہ تھا کہ کچھ مہینوں میں چیٹ جی پی ٹی لفظوں کو بامعنی انداز میں جوڑنا سیکھ گیا جس کے بعد انسانوں کو اس کے جوابات کو بہتر بنانے میں مدد ملی۔
تصور کریں کہ آپ کے پاس غیرملکی زبان کی کئی کتابیں ہوں اور ان میں سے کچھ میں تصاویر بھی دی گئی ہوں۔
آپ کو شاید احساس ہو کہ جس بھی صفحے پر ڈرائنگ یا درخت کی تصویر تھی وہاں وہی لفظ لکھا گیا تھا۔ اور ایک ہی لفظ کے ساتھ کسی گھر کی تصویر بنی ہوئی تھی۔
آپ نے شاید یہ بھی نوٹ کر لیا ہو کہ ایک لفظ کے ساتھ ’اے‘ لکھا ہے یا ’دی‘۔ اسی طرز پر کئی اور مثالیں بھی مل سکتی ہیں۔
چیٹ جی پی ٹی نے ایک بہت بڑا شماریاتی ماڈل تیار کرنے کے لیے الفاظ کے درمیان تعلق کا اس قسم کا قریبی تجزیہ کیا جسے وہ پیشین گوئیاں کرنے اور نئے جملے بنانے کے لیے استعمال کر سکتا ہے۔
اس کے لیے بھاری مقدار میں کمپیوٹنگ پاور درکار ہوتی ہے جس سے اے آئی انفرادی لفظ، جملے یا کئی صفحات پڑھ لیتا ہے اور یہ سمجھ لیتا ہے کہ انھیں کیسے بار بار استعمال کیا گیا۔ یہ ایک سیکنڈ سے بھی کم وقت میں ہو جاتا ہے۔
گذشتہ سال ڈیپ لرننگ کے ماڈلز میں نئی جدتوں نے مصنوعی ذہانت کو لے کر خوشی کے ساتھ تشویش کی لہر بھی پیدا کی ہے جو رکنے کا نام نہیں لے رہی۔
سائنس فکشن کے وعدے اور انتباہ حقیقت میں تبدیل ہو گئے ہیں اور اب ہم ایسی دنیا میں رہتے ہیں جہاں مصنوعی ذہانت اپنی عجیت و غریب غیرانسانی صلاحیتیں دکھانا شروع ہوگئی ہے۔