Global Editions

مصنوعی ذہانت کے ریسرچرز کے ڈیٹا حاصل کرنے کے انوکھے طریقے

نیچرل لینگوئیج پراسیسنگ کی نمایاں سالانہ کانفرنس میں ماہرین کے ڈیٹا جمع کرنے کے چار انوکھے طریقہ کار درج ذیل ہيں۔

ڈیٹا کا نہ صرف انٹرنیٹ پر موجود کئی فیچرز، جیسے کہ یوٹیوب کے کیپشنز، سپاٹیفائی پر گانوں کی تجاویز، اور انٹرنیٹ پر آپ کو ہر جگہ دکھائے جانے والے اشتہاروں میں بہت بڑا ہاتھ ہے، بلکہ اس نے مصنوعی ذہانت کی پیش رفت ميں بھی بہت اہم کردار ادا کیا ہے۔

لیکن جب کارآمد ڈیٹا حاصل کرنے کی بات ہوتی ہے تو مصنوعی ذہانت کے ماہرین کو جدت پسندی سے کام لینے کی ضرورت پیش آتی ہے۔ نیچرل لینگوئیج پراسیسنگ (natural-language processing - NLP) کی مثال لے لیں، جو مصنوعی ذہانت کا وہ ذیلی شعبہ ہے جس میں کمپیوٹرز کو انسانی زبانیں سکھانے کی تربیت دی جاتی ہے۔ این ایل پی میں تجرباتی طریقہ کار کی سالانہ کانفرنس میں ماہرین نے ایسی تحقیق پیش کی، جس میں نت نئے طریقوں سے معلومات حاصل کی گئی تھی۔ ہم اپنے چار پسندیدہ پراجیکٹس پیش کررہے ہیں۔

ہسپانوی اور انگریزی زبانوں کا امتزاج

س سال متعدد زبانیں استعمال کرنے والے این ایل پی کے متعلق پیپرز میں سے ایک پیپر مائیکروسافٹ کا بھی تھا، جنہوں نے "کوڈ سوئيچنگ استعمال کرنے والی زبان" یعنی دو زبانوں کے درمیان روانی سے تبدیل کرنے والا ٹیکسٹ یا گفتگو استعمال کرنے والا ماڈل پیش کیا تھا۔ پیپر پیش کیا۔ دنیا کی آدھی سے زيادہ آبادی مختلف زبانیں بول سکتی ہيں، لیکن اب تک اس اہم شعبے پر اب تک زيادہ تحقیق نہيں ہوپائی ہے۔

ان ریسرچرز نے سپینگلش، یعنی ہسپانوی اور انگریزی زبان کے امتزاج سے ابتدا کی، لیکن ان کے پاس مشین کی تربیت کے لیے سپینگلش کی تعداد کافی نہيں تھی۔ عام گفتگو میں گوڈ مکسنگ عام ہے، لیکن یہ تحریری ٹیکسٹ میں بہت کم پایا جاتا ہے۔ اس مشکل کو حل کرنے کے لیے ریسرچرز نے ایک ایسا پروگرام لکھا جو انگریزی کے الفاظ مائیکروسافٹ بنگ کے مترجم ایپ میں ڈالنے کے بعد ہسپانوی ترجمے کے جند فقروں کو اصلی ٹیکسٹ میں اس طرح واپس ڈالتا تھا تاکہ الفاظ اور فقروں کا مطلب وہی رہے۔ اس طرح ان ریسرچرز کو اچانک ضرورت کے مطابق سپینگلش میں ٹیکسٹ مل گیا۔

اس طریقے سے تیار کردہ این ایل پی ماڈل ماضی میں تخلیق کردہ تمام ماڈلز سے بہتر ثابت ہوا جنہيں ہسپانوی اور انگریزی زبانوں میں علیحدہ سے تربیت فراہم کی گئی تھی۔ ریسرچرز امید کرتے ہیں کہ ان کی تحقیق سے آگے چل کر مختلف زبانیں بولنے والے چیٹ باٹس کی تخلیق ممکن ہوگی، جو قدرتی طور پر کوڈ سوئيچنگ کا استعمال کریں گے۔

کھانے کی ترکیبوں کی کتابیں

کھانے کی ترکیبوں سے مزیدار کھانا تو بنتا ہی ہے، لیکن ساتھ ہی مشینوں کی بھی تربیت مکمن ہے۔ ان میں نہ صرف تمام اقدام مرحلہ وار درج کیے جاتے ہيں، بلکہ ٹیکسٹ کے مطابق وافر مقدار میں تصویريں بھی پیش کی جاتی ہيں، جن سے مشینوں کو بیک وقت ٹیکسٹ اور تصویریں سمجھنے کی تربیت دی جاسکتی ہے۔ یہی وجہ سے کہ ترکی میں ہیسی ٹیپ یونیورسٹی کے ریسرچرز نے تصویروں سے آراستہ بیس ہزار ترکیبوں کی مدد سے ایک بہت بڑا ڈيٹا سیٹ تیار کیا، اور وہ امید کرتے ہيں کہ اس سے تصویروں اور ٹیکسٹ کی مشترکہ تفہیم کی کارکردگی کی پیمائش ممکن ہوگی۔

اس پراجیکٹ کا نام "ریسیپی کیو اے" ہے، اور اس میں سابقہ ریسرچ سے فائدہ اٹھایا جائے گا جس میں مشین ریڈنگ کی تفہیم اور بصری تفہیم پر علیحدہ طور پر کام کیا گيا تھا۔ مشین ریڈنگ تفہیم کی صورت میں مشین کو مختلف سوالات پیش کیے جاتے ہیں جس کا جواب دینے کے لیے اسے اس سوال کو سمجھ کر ایک متعلقہ عبارت میں سے جواب ڈھونڈنے کی ضرورت ہوتی ہے۔ بصری تفہیم کی صورت میں مشین کو تصویری شکل میں جواب دینے کی ضرورت ہوتی ہے۔ بیک وقت تصاویر اور ٹیکسٹ کے استعمال سے کام کی پیچیدگی میں اضافہ ہوتا ہے، کیونکہ ان تصاویر اور ٹیکسٹ میں موجود معلومات کا آپس میں کوئی تعلق ہونا ضروری نہيں ہے۔

مختصر جملے

گوگل مصنوعی ذہانت کی مدد سے آپ کی تحریروں کو زيادہ دلچسپ بنانا چاہتے ہیں۔ اس کے لیے ریسرچرز نے لمبے جملوں کو چھوٹے جملوں میں توڑنے کے لیے دنیا کا اب تک کا سب سے بڑا ڈیٹا سیٹ تیار کیا ہے۔ اور انہيں یہ ڈیٹا کہاں سے ملا؟ وکی پیڈیا سے۔

وکی پیڈیا میں ترامیم کے وسیع و عریض ریکارڈز موجود ہیں، اور ریسرچ کی ٹیم نے اس ڈیٹا سے لمبے جملوں کو مختصر کرنے کی کئی مثالیں حاصل کی۔ اس نتیجے میں انہیں اس کام کے بینچ مارک کے مقابلے میں 60 گنا زیادہ مثالیں اور 90 گنا زیادہ الفاظ ملے۔ یہ ڈیٹا سیٹ متعدد زبانوں پر بھی مشتمل ہے۔

جب انہوں نے ایک مشین لرننگ کے ماڈل کو اپنے نئے ڈیٹا پر تربیت دی، تو وہ 91 فیصد درستی حاصل کرنے میں کامیاب رہا۔ (اس کا مطلب ہے کہ ترمیم کے بعد 91 فیصد جملوں کا مفہوم اور گرامر کی درستی برقرار رہی۔) اس کے مقابلے میں سابقہ ڈیٹا پر تربیت حاصل کرنے والے ڈیٹا کی درستی صرف 32 فیصد رہی۔ دونوں ڈیٹا سیٹس کو ملانے اور دوسرے ماڈل کی تربیت کے بعد درستی 95 فیصد تک رہی۔ ریسرچرز نے یہ نتیجہ نکالا کہ ڈیٹا کے ذرائع میں اضافہ کرکے مزید بہتریاں ممکن ہوسکتی ہيں۔

سوشل میڈیا کا تعصب

تحقیق سے معلوم ہوا کہ ہماری تخلیق کردہ زبان سے ہماری نسل، جنس، اور عمر کا اندازہ اس وقت بھی لگایا جاسکتا ہے اگر یہ معلومات واضح طور پر درج نہ ہو۔ اس بات کو مدنظر رکھتے ہوئے اسرائیل کی بار الن یونیورسٹی اور ایلن انسٹی ٹیوٹ فار آرٹیفیشل اینٹیلی جینس کے محققین نے ٹیکسٹ سے یہ ظاہر کنندگان نکالنے کی ٹھانی۔

مختلف گروپس کے زبانی پیٹرنز کی نمائندگی کرنے کے لیے کافی ڈیٹا حاصل کرنے کے لیے ان ریسرچرز نے ٹوئیٹر کا سہارا لیا۔ انہوں نے غیرہسپانی سفید فام اور سیاہ فام، مرد اور عورتوں اور 18 سے 34 سال کے درمیان اور 35 سال سے زائد عمر کے افراد برابر تقسیم شدہ صارفین کے ٹوئیٹس جمع کیے۔

اس کے بعد انہوں نے ان ٹوئیٹس میں چھپے ظاہر کنندگان کو خودکار طور پر خارج کرنے کے لیے دو نیورل نیٹورکس کا آپس میں مقابلہ کروانے کی کوشش کی۔ ایک نیورل نیٹ نے آبادی کے متعلق اعداد و شمار کی پیشگوئی کرنے کی کوشش کی، جبکہ دوسرے نے ٹیکسٹ کو مکمل طور پر غیرجانبدار بنانے کے لیے اس میں ترمیم کرنے کی کوشش کی تاکہ پہلے ماڈل کی درستی کی شرح کو 50 فیصد سے کم کیا جاسکے۔ اس طرح نسل، جنس، اور عمر کے ظاہر کنندگان کافی حد تک کم تو ہوگئے، لیکن مکمل طور پر ختم نہيں ہوسکے۔

تحریر: کیرن ہاؤ (Karen Hao)

Read in English

Authors
Top