Global Editions

سمارٹ فونز اب ٹچ سکرین کی بجائے آواز کی شناخت سے چلیں گے

پوری دنیا میں سمارٹ فون استعمال کرنے والوں کی تعداد بڑھتی جارہی ہے۔ سمارٹ فون اپنی ٹچ سکرین کی وجہ سے زیادہ پرکشش دکھائی دیتا ہے لیکن چین میں لوگ اب ٹچ سکرین سے بھی کام نہیں لیتے بلکہ سمارٹ فون سے متعلق ہر کام اپنی آواز سے لیتے ہیں۔ جس سے اب وہ لوگ بھی اسے استعمال کررہے ہیں جو پڑھ لکھ نہیں سکتے۔ اس کیلئے وہ سپیچ ٹیکنالوجی کے شکرگزار ہیں۔ آواز کی شناخت والے انٹرفیس کئی دہائیوں سے ٹیکنالوجی کے ماہرین کا خواب رہا ہے۔ آپ بیجنگ کے ہمسایہ شہر سینلیٹن(Sanlitun)میں گھوم پھر کر دیکھ لیں۔ آپ دیکھیں گے کہ خاصے لوگ ایپل(Apple)، سام سنگ(Samsung)، ژیائومی (Xiaomi)کے سمارٹ فون لئے گھوم رہے ہیں لیکن وہ اسے استعمال کرتے وقت ٹچ سکرین کو نظر انداز کرکے اپنی آواز سے کام لے رہے ہیں۔ جس طرح بیدُو نے آواز کی شناخت کے نظام کو ترقی دی ہے اسے پوری دنیا میں استعمال کیا جاسکتا ہے۔ اس سے ہر کسی کیلئے سمارٹ فون کے ذریعے ابلاغ کرنا نہایت آسان ہو جاتا ہے۔ چین میں سمارٹ فون استعمال کرنے والے 691ملین افرادجب سرچ انجن بیدُو (Baidu)پر کچھ تلاش کرتے ہیں تو ٹچ سکرین کو نظرانداز کردیتے ہیں۔ آواز کی شناخت والے سمارٹ فون انٹر فیس کیلئے چین آئیڈیل ملک ہے کیونکہ چینی زبان کے پیچیدہ اور مشکل حروف کوچھوٹی سی سکرین پر لکھنا بہت مشکل ہے۔

ایم آئی ٹی ٹیکنالوجی ریویو کے 2008ء میں منتخب 35انوویٹرز میں سے ایک ، بیدُو کے چیف سائنسدان اور سٹینفورڈ یونیورسٹی کے ایسوسی ایٹ پروفیسر اینڈریواین جی (Andrew Ng)کہتے ہیں کہ ایک مرحلے پر آ کر آواز کی شناخت کا کام آسان اور قابل اعتماد ہو جاتا ہے۔ حال ہی میں مشین لرننگ میں ترقی کی وجہ سے آواز کی شناخت کروانا عملی طور پر زیادہ بہتر ہو گیا ہے۔ حتیٰ کہ آپ بہت شور والی جگہوں پر بھی اپنی آواز سے سمارٹ فون استعمال کرسکتے ہیں۔ آواز کی شناخت کیلئے ایپل کا سیری(Siri)، مائیکروسوفٹ کا کورٹانا (Cortana) اور گوگل نائو(Google Now)سوفٹ وئیر زیادہ تر سمارٹ فونز اور نئے آلات میں بہترین کام کررہے ہیں۔ ان سسٹمز کو ابھی بولے گئے الفاظ کی درست شناخت کرنے میں مشکلات درپیش ہیں۔ لیکن یہ کمپنیاں اپنے نظام کو بتدریج بہتر بنانے میں لگی ہوئی ہیں جس کے حوصلہ افزا نتائج نکل رہے ہیں۔

graph_0

بیدُو اپنے نظام کو بڑی متاثر کن ترقی دے رہا ہے۔ یہ کمپنی گوگل کے جواب میں 2000ء میں بنائی گئی تھی۔ اس کے ذریعے موسیقی، فلمیں، بینکنگ، انشورنس غرض ہر قسم کی خدمات فراہم کی جارہی ہیں۔ ملک کے 70فیصد لوگ اس کی خدمات سے فائدہ اٹھا رہے ہیں۔ چین کی نمایاں انٹرنیٹ کمپنی نے اپنی طاقتور سپیچ ٹیکنالوجی سے سمارٹ فون کا استعمال نہایت آسان کردیا ہے۔ موثر موبائل فون انٹرفیس چین میں لوگوں کی بہت مدد کرسکتا ہے۔ سمارٹ فون ویب سرچنگ، پیغام رسانی اور ایسے ہی سر درد لگانے والے دیگرکاموں کو تیزی سے سرانجام دینے کیلئے لیپ ٹاپ اور ڈیسک ٹاپ سے زیادہ بہتر ہے۔ چینی زبان کے ہزاروں حروف ہیں جنہیں پینین (Pinyin)سسٹم کے ذریعے انہیں لاطینی زبان میں لکھا جاسکتا ہے لیکن پچاس سال سے زیادہ عمر کے لوگ کی بورڈ کا استعمال نہیں جانتے۔ چین میں وی چیٹ (Wechat)کا سوفٹ وئیر تمام کاموں کو سرانجام دینے کیلئے استعمال کیا جاتا ہے۔

اینڈریو این جی کہتے ہیں کہ ٹیکنالوجی کے ذریعے مشینوں کو آواز کی شناخت درست طور پر کروانا ایک چیلنج ہے۔ لوگوں کو ڈیسک ٹاپ کی تربیت دینے کی بجائے آواز کے ذریعے کام سرانجام دئیے جائیں۔ اینڈریو کو یقین ہے کہ جلد ہی تمام مشینوں سےآواز کی شناخت کے ذریعے کام لیا جاسکے گا۔ مثلاً گھر یلو روبوٹس سے بات چیت کرکے کام لینا آسان ہو جائے گا۔ کمپنی کا ہیڈکوارٹر بیجنگ میں ہے لیکن اسے مشینوں میں آواز کی شناخت پر کام کرنے کیلئے سلیکون ویلی میں بھی سہولت دی گئی ہے۔ ایم آئی ٹی کے سینئر سائنسدان جِم گلاس(Jim Glass)کہتے ہیں کہ میرے خیال میں آواز کی شناخت کے ذریعے مشینوں سے بات چیت کا وقت آگیا ہے۔ لوگ چاہتے ہیں کہ وہ ریموٹ کنٹرول کی بجائے اپنی آواز سے آلات کو کنٹرول کریں۔ ہمارا معاشرہ اب اس مرحلے میں داخل ہو چکا ہے۔

بیدُو نے گزشتہ سال نومبر میں اعلان کیا کہ اس کی سلیکون ویلی میں قائم لیبارٹری نے آواز کی شناخت کیلئے طاقتور انجن ڈیپ سپیچ ٹو (Deep Speech 2)کے نام سے بنایا ہے۔ یہ انجن بولے گئے لفظوں کو حیران کن درستگی کے ساتھ شناخت کرسکتا ہے۔ حتیٰ کہ تحقیق کاروں کے خیال میں یہ سرچ انجن چینی زبان مینڈرین (Mandrin)کے چھوٹے چھوٹے لفظوں کی کسی شخص سے زیادہ آسانی سے وضاحت کرسکتا ہے۔ بیدُو کی تحقیق بڑی متاثر کن ہے کیونکہ مینڈرین کے لفظ اور حروف بڑے پیچیدہ ہیں۔ بیدُو کا اصل چیلنج بولے گئے پیچیدہ اور مشکل الفاظ کی شناخت کروانا ہے۔ بیدُو نے سمارٹ فونز میں آواز کی شناخت کا اپنا اسسٹنٹ ڈیواِر(DuEr)کے نام سے متعارف کروایا ہے۔

تحریر: وِل نائیٹ (Will Knight)

10-breakthrough-technologies-2016-conversational-interfaces

Read in English

Authors

*

Top