Global Editions

ڈیٹا ماڈلنگ: اعداد و شمار کے پیچھے کتنا دھوکا چھپا ہے؟

اعداد و شمار پر مشتمل ماڈلنگ پالیسی سازی کا صرف ایک عنصر ہونا چاہیے۔ ماڈلز کی بنیاد پر کرونا وائرس کے پھیلاؤ کی پیشگوئی کرتے وقت لاک ڈاؤنز سے وابستہ معاشی مسائل کو مدنظر رکھنا ضروری ہے۔

16 مارچ کو لندن کے امپیریل کالج (Imperial College) کی covid-19 ریسپانس ٹیم (Response Team) نے ایک پیپر شائع کیا، جس میں کرونا وائرس کے باعث شرح اموات کے متعلق کئی خوفناک قسم کی پیشگوئیاں شامل تھیں۔ مثال کے طور پر، اس ٹیم کے کیلکولیشنز کے مطابق امریکہ میں 22 لاکھ افراد اس مرض کے باعث اپنی جانوں سے ہاتھ دھو بیٹھیں گے۔ دنیا بھر کی حکومتیں کرونا وائرس کے متعلق پالیسیاں تیار کرنے کے لیے انہی پیشگوئیوں پر انحصار کررہی ہيں۔

تاہم، جیسے جیسے مزید ڈیٹا دستیاب ہورہا ہے، ریسرچرز کی اس وائرس کے پھیلاؤ اور اس کے باعث شرح اموات کے متعلق کیلکولیشنز میں بھی تبدیلی آرہی ہے۔ کسی بھی ڈیٹا ماڈل میں ان تمام عناصر کو مدنظر نہیں رکھا جاسکتا جو کسی نتیجے تک پہنچنے کے لیے ضروری ہوں، اور اسی لیے ان ماڈلز کی بنیاد پر سو فیصد درست پیشگوئی نہيں کی جاسکتی۔ یہ مسئلہ خاص طور پر معاشرتی علوم یا معیشیات کے شعبے میں پیش آتا ہے، جہاں ریسرچرز سیاسی یا ثقافتی پس منظر کی ناقابل تعین نوعیت کی بنیاد پر پیشگوئیاں کرتے ہیں۔ ان خامیوں کو نظرانداز کرکے کبھی بھی موثر پبلک پالیسی تیار نہیں کی جاسکتی۔

 جتنا گڑ، اتنا میٹھا

امپیریل کالج کی ریسرچ کی مثال لیتے ہيں۔ اسے کرونا وائرس کی وبا کی تیزی سے پھیلنے کے خطرہ کو اجاگر کرنے کی وجہ سے سراہا تو بہت گیا ہے، لیکن ساتھ ہی اس میں شامل ڈیٹا کے ماڈلز کی خامیوں کے باعث تنقید کا نشانہ بھی بنایا گيا ہے۔ نیو انگلینڈ کامپلیکس سسٹمز انسٹی ٹیوٹ (New England Complex Institute – NECSI) نے ایک تحریر میں لکھا کہ اس مطالعے میں علامات کے اظہار سے پہلے انفیکشن کے شکار افراد کی علیحدگی کو ممکن بنانے والے کانٹیکٹ ٹریسنگ کا تذکرہ موجود نہيں تھا۔ اس کے علاوہ، اس تحقیق میں گھر گھر جا کرعلامات کا اظہار کرنے والے افراد کی نشاندہی کرنے والی ٹیموں کی سرگرمیوں کو بھی نظرانداز کیا گيا تھا۔

امپیریل کالج کے مطالعے کے بعد بڑی تعداد میں سائنسی مواد شائع ہوا، جس کے تجزیے میں یہ بات سامنے آئی کہ covid-19 کے اثرات کی درست پیشگوئی کے لیے چار عناصر نہایت اہم ہیں: انفیکشن کے شکار کسی بھی شخص کی وجہ سے متاثر ہونے والے دوسرے افراد کی تعداد (جسے ریپلی کیشن پیرامیٹر (Replication Parameter) یا R0 کہا جاتا ہے)؛ انفیکشن کا شکار ہونے والے افراد کی تعداد، ہسپتال میں داخل افراد کی تعداد، اور موت کا شکار ہونے والے افراد کی تعداد۔ ڈیٹا ماڈلز اس قدر حساس ہوتے ہيں کہ کسی ایک عنصر میں ذرا سی بھی اونچ نیچ سے پیشگوئی میں بہت زیادہ تبدیلی آسکتی ہے۔ یعنی ہم ماڈلز کے لیے جتنا زیادہ درست ڈیٹا استعمال کریں گے، ہمیں اتنے ہی بہتر نتائج ملیں گے۔

انفیکشن کے شکار افراد کی تعداد کی مثال لیتے ہيں۔ امپیریل کالج کے مطالعے کے مطابق ابھی تک 40 سے 50 فیصد متاثرہ افراد کی نشاندہی نہيں ہوسکی ہے۔ اس میں ایسے لوگ شامل ہيں جن میں کرونا وائرس کی علامات یا تو واضح نہيں ہوئی ہیں یا شدت اختیار نہيں کرسکی ہیں۔ کیسز کی تعداد کم کرکے بتانے سے کافی زيادہ نقصانات سامنے آسکتے ہيں۔ سب سے پہلے تو ممکن ہے کہ شرح اموات ہماری توقعات سے کہیں زیادہ کم نکلے۔ اس کے علاوہ، ممکن ہے کہ لوگوں میں اس مرض کے خلاف مدافعت پیدا ہوچکی ہو، جس کی وجہ سے دنیا بھر میں ایسے افراد بڑی تعداد میں موجود ہیں جن میں کرونا وائرس کی نشاندہی نہيں ہوسکی ہے۔ اگر یہ بات ثابت ہوجائے کہ وائرس کافی عرصے سے موجود ہے تو یہ بھی ہوسکتا ہے کہ قرنطینہ اور دوسروں سے علیحدگی جیسے اقدام غیرضروری ثابت ہوجائيں۔

دوسرا مسئلہ یہ ہے کہ زیادہ تر ماڈلز میں انفیکشن کے شکار کسی بھی شخص کے باعث متاثر ہونے والے افراد کی اوسط تعداد کے کیلکولیشن کے لیے چین کے صوبہ ووہان سے حاصل کردہ ابتدائی ڈیٹا کا استعمال کیا گیا ہے۔ امپیریل کالج کی ریسرچ کے مطابق یہ اوسط تعداد 2.0 اور 2.6 کے درمیان تھی، لیکن اب اسے تبدیل کرکے 3.0 کردیا گیا ہے۔ یہ تبدیلی دیکھنے میں تو چھوٹی سی ہے، لیکن اس سے ہماری پیشگوئیاں بہت زيادہ متاثر ہوئی ہیں۔ اس سے یوں ظاہر ہوتا ہے کہ کرونا وائرس سے متاثر ہونے والے افراد کی تعداد ہماری توقعات سے کہیں زيادہ ہے اور اجتماعی قوت مدافعت کا ہدف ہماری توقعات سے بہت پہلے حاصل ہوجائے گا۔ اس کے علاوہ، لوگوں کی بہت بڑی تعداد کے کرونا وائرس کا شکار ہونے کے باعث ممکن ہے کہ قرنطینہ جیسے اقدامات زيادہ موثر ثابت نہ ہوں۔

خلاصہ یہ ہے کہ ماڈلز تیار کرنے میں جتنا درست ڈیٹا استعمال کیا جائے گا، نتائج اتنے ہی قابل اعتماد ہوں گے۔ یہ اصول ان ماڈلز کی صورت میں زيادہ اہمیت اختیار کرتا ہے جن میں کسی چیز کے بڑی تیزی سے بڑھنے کے متعلق پیشگوئی کی جارہی ہو۔ ڈیٹا میں ذرا سی بھی اونچ نیج سے نتائج میں بہت زیادہ تبدیلی آئے گی۔ ہمیں covid-19 کی وبا میں اس کی بہت اچھی مثال ملتی ہے۔ جیسے جیسے کرونا وائرس کے متعلق زيادہ ڈیٹا حاصل ہوتا ہے، ماڈلز کی حساسیت واضح ہوتی رہتی ہے۔ مثال کے طور پر، 7 اپریل تک یونیورسٹی آف واشنگٹن کے انسٹی ٹیوٹ آف ہیلتھ میٹرکس اینڈ ایویلویشن (Institute of Health Metrics and Evaluation – IHME) کے ماڈل کے مطابق امریکہ کی کئی ریاستوں میں کرونا وائرس کے باعث اموات میں کمی کا امکان سامنے آچکا تھا۔ ان کیلکولیشنز کے مطابق متوقع شرح اموات ابتدائی تخمینے کے مقابلے میں شمالی کیرولائنا میں 80 فیصد، پینسلوینیا میں 75 فیصد، کیلیفورنیا میں 70 فیصد، ٹیکسس میں 65 فیصد اور واشنگٹن میں 55 فیصد کم تھیں۔ اس کے علاوہ، لوئیسیانا کی متوقع شرح اموات ابتدائی اعداد و شمار کا صرف ایک تہائی حصہ تھے۔ اسی طرح، اپریل میں مزید ڈیٹا کی دستیابی کے باعث نارتھ ایسٹرن یونیورسٹی اور کولمبیا یونیورسٹی کے ماڈلز کی پیشگوئیوں میں بھی تبدیلی دیکھی گئی۔

اعداد و شمار کے چکر میں عدم مساوات کو نظرانداز کیا جاتا ہے

کرونا وائرس کے متعلق کیلکولیشنز پیش کرنے والے ماڈلز کی دوسری سب سے بڑی خامی کی وجہ ان میں شامل ڈیٹا ہے۔ ان ماڈلز میں صرف انفیکشنز اور اموات کی تعداد اور ہیلتھ کیئر کے سسٹمز پر اس وبا کے بوجھ کی بات کی جاتی ہے۔ ان مسائل کی اہمیت سے انکار نہيں کیا جاسکتا، لیکن ان پر زیادہ توجہ دینے کے چکر میں اکثر مختلف ممالک کے درمیان عدم مساوات کو نظرانداز کردیا جاتا ہے۔

کچھ ممالک اپنے شہریوں کو امداد فراہم کرنے کے لیے اربوں ڈالر خرچ کرسکتے ہيں، لیکن غربت، مہنگائی، اور عدم استحکام کے شکار ممالک ایسا نہيں کرپاتے۔ امریکہ جیسے ترقی یافتہ ملک میں بھی لاک ڈاؤن کے مالی نقصانات کساد عظیم (Great Depression) کے اثرات سے کم نہيں ہیں۔ اس کے علاوہ، لاک ڈاؤن کے دوران گھر میں قید رہنے اور باہر کی دنیا سے تعلقات منقطع ہونے کے باعث گھریلو تشدد اور جنسی ہراس جیسے معاشرتی مسائل میں بھی اضافہ ہوتا ہے۔

پاکستان جیسے کئی ممالک ہيں جو مالی عدم استحکام کا شکار ہيں اور جہاں بڑی تعداد میں لوگ غذا، صاف پانی اور ہیلتھ کیئر جیسی سہولیات سے محروم ہیں۔ پورے ملک میں مکمل لاک ڈاؤن نافذ کرنے سے عوام پر مصیبتوں کے کئی پہاڑ ٹوٹ پڑيں گے۔ صرف کرونا وائرس کے باعث شرح اموات اور ہیلتھ کیئر کے سسٹمز پر گنجائش سے زیادہ بوجھ کی تصویر کشی کرنے والے ماڈلز میں اکثر ان مالی اور معاشرتی حقائق کی بات نہيں کی جاتی۔ ان خامیوں کی وجہ سے پالیسی سازوں کے لیے پالیسیاں تشکیل کرنے کے دوران ہیلتھ کیئر کے علاوہ اپنے ملک کی مالی اور ثقافتی صورتحال مدنظر رکھنا اور ہر فیصلے کے فوائد و نقصانات کی پوری طرح جانچ پڑتال کرنا ضروری ہیں۔

نیم حکیم، وبال جان

کسی نے خوب کہا ہے کہ ”نیم حکیم، وبال جان “۔ ماڈلز کی بنیاد پر پیشگوئیاں کرنے کے دوران احتیاط سے کام لینا چاہیے، خاص طور پر اس صورت میں جب لاکھوں زندگیوں اور اربوں ڈالرز کا سوال ہو۔ ماہرین وبائیات کی تجاویز کو بغیر سوچے سمجھے عملدرآمد کرنا بہت بڑی بے وقوفی ہے۔ کسی بھی ماڈل میں اس بحران کی پیچیدگی کی مکمل طور پر نمائندگی نہيں کی جاسکتی۔ اگلی نسلوں کو بچانے کے لیے پالیسیوں کے تمام نقصانات کو ساتھ لے کر چلتے ہوئے اس بحران کا حل تلاش کرنا ہوگا۔ اس وقت ہماری رہنمائی کے لیے کوئی قواعد موجود نہيں ہیں، اور اسی لیے بدلتی ہوئی صورتحال کے مطابق حکمت عملیاں تیار کرنے کی ضرورت ہے۔ پالیسی سازوں کو اعداد و شمار پر مشتمل ماڈلز کا سہارا ضرور لینا چاہیے، لیکن ان کو سو فیصد سچ نہيں تسلیم کرنا چاہیے۔

حماد خان انالیٹیکل سسٹمز کی تیز ترقی پر توجہ مرکوز کرنے والے ٹیکنالوجی ایگزیکٹو ہیں۔ وہ اس وقت امریکہ کے شہر پورٹ لینڈ میں رہائش پذیر ہیں اور پریڈیکٹو اور پریسکرپٹیو انالیٹیکس پر مرکوز ٹیکنالوجی کے ساتھ کام کررہے ہيں۔

تحریر: حماد خان

مترجم: صوفیہ ضمیر

Read in English

Authors

*

Top