Global Editions

مشینیں خود کو تربیت دینے کی کوششیں کررہی ہیں

مشینوں کو زبان کا استعمال سکھانا مشکل ہے۔ اس لیے انھیں خود ہی سیکھ لینی چاہیے۔

مشینیں تھری ڈی ورچول دنیاؤں کو ایکسپلور کر کے غیرپیچیدہ کمانڈز پراسیس کرنا سیکھ کرہی ہیں۔

ایمزان کے الیکسا اور گوگل ہوم جیسی ڈیوائسز سے آواز سے کنٹرول ہونے والی ٹیکنالوجی کی مقبولیت میں کافی اضافہ ہوگیا ہے، لیکن ابھی بھی یہ ڈیوائسز مختصر اور غیرپیچیدہ کمانڈز سے آگے نہیں بڑھ پائی ہیں۔ مشینوں کو اس قدر ذہین بنانا کہ وہ ایک مکالمہ جاری رکھ سکیں، ابھی بھی مشکل ثابت ہورہا ہے۔ اور ہوسکتا ہے کہ یہ حقیقی دنیا کو سمجھے بغیر ممکن بھی نہ ہو۔

الفاظ، اشیاء اور اعمال کے درمیان تعلقات کی ہارڈ کوڈنگ کے ذریعے اس مسئلے کو حل کرنے کے لیے لاتعداد قواعد کی ضرورت ہوگی، لیکن اس طرح مشینیں خود کو نئی صورتحالوں کے مطابق ڈھالنے سے قاصر رہیں گی۔ اس کے علاوہ دوسرا مسئلہ یہ ہے کہ مشینیں عام طور پر اس وقت تک خود سے لسانی صلاحیتیں حاصل نہیں کرسکتی ہیں جب تک انھیں اسانی معاونت حاصل نہ ہو۔

الفابیٹ (Alphabet) نامی کمپنی کی ایک ذیلی کمپنی ڈیپ مائنڈ (DeepMind)، جو مصنوعی ذہانت کے کئی پراجیکٹس پر کام کرچکی ہے، اور کارنیگی میلن یونیورسٹی (Carnegie Mellon University) سے تعلق رکھنے والی ٹیمیں اسی مسئلے پر کام کررہی ہیں، اور اب انھوں نے ایک ایسا طریقہ ڈھونڈ نکالا ہے جس کے ذریعے مشینیں کمپیوٹر کے گیمز کی طرح کے تھری ڈی ماحول میں رہتے ہوئے خود سے کسی زبان کی بنیادی اصول سیکھ سکتے ہیں۔

دیوندر چیپلٹ، جو اس وقت کارنیگی میلن یونیورسٹی میں ماسٹرز کے پروگرام میں زیرتعلیم ہیں اور جو عنقریب اسوسیشن فار کمپیوٹیشنل لنگویسٹکس (Association for Computational Linguistics) کی سالانہ میٹنگ میں اپنا پیپر پیش کرنے والے ہیں، کہتے ہیں کہ تھری ڈی کے ماحول میں اس مقصد کا حصول اصلی دنیا میں نتائج حاصل کرنے کا پہلا قدم ہے۔ ان کے مطابق اس پراجیکٹ کا مقصد ایک ایسی سیمولیشن تیار کرنا ہے جو حقیقی دنیا سے اس حد تک ملتا جلتا ہو کہ ایک تربیت یافتہ مصنوعی ذہانت کا سسٹم حقیقی دنیا میں بہ آسانی اپنے سیکھے گئے اصول کا استعمال اور اطلاق کرسکے۔

ڈیپ مائنڈ اور سی ایم یو ڈیپ ری انفورسمنٹ لرننگ (deep reinforcement learning) سے فائدہ اٹھا رہے ہیں، جس کی مقبولیت کا سہرا ڈیپ مائنڈ کی ویڈيو گیمز کھیلنے والے مصنوعی ذہانت کے سسٹم کے سر جاتا ہے۔ اس سسٹم میں ایک نیورل نیٹورک کو ایک ورچول ماحول سے حاصل کردہ خام پکسل کا ڈيٹا فراہم کیا جاتا ہے، اور اسے کمپیوٹر گیمز کی طرح کے انعامات کی مدد سے غلطیوں سے سبق حاصل کرنے کی تربیت فراہم کی جاتی ہے۔

گیمز کے برعکس، جن کا مقصد زیادہ سے زیادہ سکور کا حصول ہے، مصنوعی ذہانت کے یہ پروگرامز فراہم کردہ ہدایات کے مطابق درست اشیاء کا انتخاب کرکے انعامات حاصل کرنے کی کوششیں کرتے ہیں۔

ایک طویل و عریض تربیتی پروگرام سے گزرنے کے بعد، مصنوعی ذہانت کے دوںوں پروگرامز نے کئی مختلف الفاظ کو مخصوص اشیاء اور خصوصیات سے جوڑنا سیکھ لیا، جس کے بعد ان کے لیے کمانڈز پر عمل کرنا آسان ہوگا۔ وہ ایسے الفاظ بھی سیکھنے میں کامیاب ثابت ہوئے جن کی مدد سے وہ ملتے جلتے اشیاء کے درمیان امتیاز کرسکیں۔

سب سے اہم بات جو سامنے آئی وہ یہ تھی کہ ان دونوں پروگراموں نے تربیت کے دوران جو معلومات حاصل کی تھی، وہ اسے ایک انجان صورتحال میں بھی استعمال کرنے میں کامیاب ثابت رہے۔ مثال کے طور پر وہ اس وقت بھی کسی مخصوص رنگ کے اشیاء کی درست نشاندہی کرپاتے جب انھیں تربیت میں صرف چند اشیاء کے نام اور چند رنگوں کے نام سکھائے گئے تھے، لیکن اس رنگ کی وہی چیز نہیں دکھائی گئی تھی۔

چیپلٹ کے مطابق یہ خصوصیت ان سسٹمز کو قواعد پر چلنے والے پرانے سسٹمز سے زيادہ لچک دار بنانے کی وجہ بنے گی۔ کارنیگی میلن کی ٹیم نے وژول اور زبانی ان پٹ کو اس طرح پیش کیا کہ مصنوعی ذہانت کا سسٹم صرف متعلقہ معلومات کو ہی پراسیس کرسکے، جبکہ ڈیپ مائنڈ نے سسٹم کی کارکردگی میں بہتری لانے کے لیے اس کے تربیتی اہداف میں اضافہ کرنے کی کوشش کی۔ چیپلٹ کہتے ہیں کہ یہ دونوں سسٹمز ایک ہی مسئلے کو دو مختلف طریقوں سے حل کرنے کی کوشش کررہے ہیں، جس کی وجہ سے انھیں ضم کرنے سے کارکردگی میں قابل قدر بہتری ممکن ہے۔

ڈیپ مائنڈ کے ریسرچرز سے اس سلسلے میں رابطہ کرنے کی کوششیں ناکام رہیں۔

مختلف مشین لرننگ کے طریقہ کار کے متعلق کتاب دی ماسٹر الگارتھم (The Master Algorithm) کے مصنف پیڈرو ڈومینگوس (Pedro Domingos)، جو یونیورسٹی آف واشنگٹن کے پروفیسر بھی ہیں، کا کہنا ہے کہ اب تک کی پیش رفت قابل تعریف ہے، لیکن ابھی یہ تحقیق صرف ابتدائی مراحل میں ہے، اور یہ کس حد تک کامیاب ہوگی؟ اس کے بارے میں اس وقت یقین سے کچھ نہیں کہا جاسکتا ہے۔

اس ریسرچ کے بعد مصنوعی ذہانت کا زبان اور روبوٹک کنٹرول جیسے پیچیدہ مسائل کو ضم کرنے کا نیا رجحان سامنے آیا ہے۔ تاہم، ڈومینگوس کہتے ہیں کہ توقعات کے خلاف اس سے دونوں چیلنجز زیادہ آسان ہوتے ہیں، کیونکہ حقیقی دنیا ميں رہنے سے زبان سمجھنے میں زیادہ آسانی ہوتی ہے، اور محض تھوڑی سی رہنمائی کے بعد دنیا کے متعلق بہتر سمجھ بوجھ حاصل کی جاسکتی ہے۔

ڈيپ ری انفارسمنٹ لرننگ کے لیے لاکھوں دفعہ تربیت فراہم کرنے کی ضرورت ہے، اور اس وجہ سے ڈومینگوس کے مطابق یہ حقیقی دنیا میں زيادہ قابل عمل ثابت نہیں ہوپائے گا۔ ان کے خیال میں ڈیپ مائنڈ کا الفا گو (AlphaGo) نامی سسٹم، جسے مصنوعی ذہانت کے شعبے میں نمایاں مقام حاصل ہے، مختلف مصنوعی ذہانت کے طریقوں کے انضمام کی ایک بہتر مثال ہے۔

براؤن یونیورسٹی کے پروفیسر ری انفورسمنٹ لرننگ کے ماہر مائیکل لٹ مین (Michael Littman) کہتے ہیں کہ ماضی میں زبان کے سیمولیٹز صرف ٹو ڈائمنشنل ماحول تک ہی محدود تھے، اور ان سسٹمز میں جو وژول ان پٹ استعمال کیا گيا ہے، وہ ماضی میں استعمال ہونے والے ان پٹ سے کافی زيادہ پیچيدہ تھا، جس کی وجہ سے اس کے نتائج قابل تعریف ہیں۔

لٹ مین ڈومینگوس سے اس بات پر متفق ہیں کہ یہ سسٹم حقیقی زندگی میں کچھ خاص کامیاب نہیں ہوگا۔ ان کے مطابق اس سسٹم کو سیمولیٹر کے اہداف کے مطابق مخصوص اور محدود کمانڈز دیے جاتے ہیں جبکہ عملی زندگی میں صارفین اپنی مرضی کے مطابق کوئی بھی کمانڈ دے سکتے ہیں۔

وہ کہتے ہیں “مجھے ڈر ہے کہ لوگ صرف ان نتائج سے متاثر ہو کر ان نیٹورکس کو کامیاب سمجھ بیٹھیں گے۔”

تحریر: ایڈ جنٹ (Edd Gent)

Authors

*

Top