Global Editions

اب لب شناسی بھی مصنوعی ذہانت کی مدد سے۔۔۔

ہونٹوں کی حرکت سے بات کو سمجھنا یعنی لب شناسی ایک ایسا علم ہے جس کی مدد سے عموماً اعلٰی شخصیات کی گفتگو کے بارے میں اندازا لگایا جاتا ہے اسی علم کی مدد سے قوت گویائی سے محروم افراد کی بات کو سمجھا جاتا ہے۔ اگرچہ لب شناسی ایک ناپسندیدہ مگر مشکل امر ہے اور اس کے لئے ضروری ہے کہ لب شناسی کرنے والا، زبان کے حوالے مکمل آگاہی رکھتا ہو کیونکہ لب شناسی کے لئے صرف چہرے کی حرکات کا جاننا ہی کافی نہیں اس کےلئے ضروری ہے کہ زبان سے مکمل طور پر آگاہی حاصل ہو۔ اب تحقیق کاروں نے اس ضمن میں بھی مشینی آموزش کا سہارا لینا شروع کر دیا ہے اور مشینی آموزش کے ذریعے آواز کے بغیر کسی بھی ویڈیو کلپ میں مقرر کی جانب سے ادا کئے جانیوالے جملوں کو سمجھا جا سکتا ہے۔ یونیورسٹی آف آکسفورڈ کے شعبہ کمپیوٹر سائنسز کے تحقیق کاروں کی ایک ٹیم نے مصنوعی ذہانت کا حامل نظام ایجاد کیا ہے جسے LipNet کا نام دیا گیا ہے۔ اس نظام کے ذریعے کسی بھی شخص کے ہونٹوں سے ادا ہونے والے جملوں کی شناخت کی جا سکتی ہے اور اس کے لئے ضروری ہے کہ ادا کئے جانیوالے جملے کا دورانیہ تین سیکنڈ سے کم نہ ہو اور ادا کیا جانیوالا جملہ الفاظ کا مکمل مجموعہ ہو۔ اس نیٹ ورک کی تیاری کے لئے تحقیق کاروں کی ٹیم نے حاصل شدہ ڈیٹا کی مدد سے نیورل نیٹ ورک تشکیل دیا۔ یہ ایک ویسا ہی پلیٹ فارم ہے جو سپیچ ریکیگنیشن کے لئے استعمال ہوتا ہے۔ نیورل نیٹ ورک منہ سے ادا ہونے والے الفاظ کی ادائیگی کےلئے چہرے کی بناوٹ اور الفاظ کی لئے ہونٹوں کی حرکت کا مشاہدہ کرتا ہے اور اس سے اندازہ لگاتا ہے کہ ادا شدہ الفاظ کیا ہیں۔ تاہم یہ نظام ٹکڑوں میں الفاظ کی شناخت نہیں کرتا بلکہ جملوں کو ہی شناخت کرتا ہے۔ اس نظام کے تجربات کے دوران حاصل شدہ نتائج کی کامیابی کی شرح 93.4 فیصد رہی۔ انہی تجربات کے دوران جب لب شناسی کے ماہرین کو وہی ویڈیو کلپ دکھائے گئے تو ان کی کامیابی کا تناسب 52.3 فیصد رہا۔ اس حوالے سے ’’ نیو سائنٹسسٹ‘‘ کی رپورٹ میں کہا گیا ہے کہ آکسفورڈ یونیورسٹی کے شعبہ کمپیوٹر سائنس سے ہی تعلق رکھنے والی تحقیق کاروں کی ایک اور ٹیم نے بھی ایسے ہی پراجیکٹ پر کام کیا ہے اور وہ ٹیم گوگل ڈیپ مائنڈ کے ساتھ کام کر رہی ہے اور اس نے اس سے زیادہ مشکل ٹاسک سرانجام دیا ہے۔ اس ٹیم نے بی بی سی سے مختلف زبانوں میں حاصل کئے جانیوالے ویڈیو کلپس کی مدد سے لب شناسی کی ہے۔ان تجربات کے لئے تحقیق کاروں کی اس ٹیم نے ایک لاکھ ویڈیو کلپس کا جائزہ لیا۔آکسفورڈ اور ڈیپ مائنڈ کی ٹیم نے اپنے تیار کردہ مصنوعی ذہانت کے نیورل نیٹ ورک کے ذریعے لب شناسی کی مدد سے جن جملوں کا درست اندازہ لگایا اس کی شرح 46.8 فیصد رہی۔ جبکہ لب شناسی کے ماہرین نے صرف 12.4 فیصد جملوں کا درست اندازہ لگایا۔ تجربات کے نتائج اپنی جگہ تاہم مصنوعی ذہانت کے شعبے میں ہونے والے تجربات سے اس امر کا اندازہ ضرور ہوتا ہے کہ اس میدان میں ترقی کی کتنی گنجائش موجود ہے اور کس طرح سے اس ٹیکنالوجی کی مدد سے نئے نئے سافٹ وئیر تیار کئے جا سکتے ہیں۔

تحریر: جیمی کونڈیلفی (Jamie Condliffe)

Read in English

Authors

*

Top