دیگر لازم نیست برای فهمیدن رفتار مردم پرسشنامهها توزیع شوند. رسول محسنزاده، انسانشناس، پژوهشگر و متخصص داده در حوزهی علوم اجتماعی محاسباتی، در گفتوگو با خبرنگار آناتک توضیح میدهد که چگونه دادههای دیجیتال توانستهاند جایگزین روشهای سنتی شوند. این دادهها نهتنها تصویری بهروز و لحظهای از جامعه ترسیم میکنند، بلکه امکان پیشبینی تغییرات رفتاری و مدیریت بحرانهای شهری را نیز فراهم میآورند.
دادههای دیجیتال (مانند دادههای موبایل، شبکههای اجتماعی یا حملونقل عمومی) چه تصویر تازهای از رفتار شهروندان به ما میدهند؟
یکی از پرسشهای همیشگی در علوم اجتماعی، بهویژه در حوزهی نگرشسنجی، این بوده که افراد چه دیدگاهی در مورد مسائل مختلف دارند، چگونه فکر میکنند، چگونه عمل میکنند، چه ذائقههایی دارند و بهطور کلی افراد چه تصویری از جهان پیرامون خود، اعم از مسائل اجتماعی، فرهنگی و حتی شخصی دارند. ما در علوم اجتماعی معتقدیم که این دیدگاهها بهشدت با جایگاه اجتماعی، طبقاتی، فرهنگی و جنسیتی افراد ارتباط دارد.
کاری که ما بیشتر بهعنوان جامعهشناس انجام دادهایم، در قالب پیمایشها و نظرسنجیها، طراحی و پخش پرسشنامه بوده است. یعنی پرسشنامهای توزیع میکردیم و دیدگاه افراد در مورد مسائل مختلف را مورد پرسش قرار میدادیم. اما این روش هم بسیار هزینهبر است و هم زمانبر و اساسا بهروز نیست. شما نمیتوانید هر لحظه و هر زمان که بخواهید این دادهها را در اختیار داشته باشید و بررسی کنید. در بهترین حالت، اگر همین الان بخواهم یک پیمایش انجام دهم، نیازمند طراحی پرسشنامه، پیادهسازی و تحلیل هستم که اگر بخواهیم خیلی فوری انجام شود، حداقل ۱۰ روز زمان میبرد تا این دادهها در اختیار قرار گیرد.
روشهای دیگری مانند مشاهده یا تحقیقات کیفی نظیر مصاحبه هم وجود دارد، اما آنها نیز مشکلات خاص خود را دارند و چندان به مسئلهی ما ارتباطی پیدا نمیکنند.
برای مثال، فرض کنید بخواهیم بدانیم مردم به کدام ابزار حملونقل بیشتر تمایل دارند. در اینجا لازم است پرسشنامهای در شهر تهران توزیع شود. باید جامعهی آماری مشخصی وجود داشته باشد؛ بهگونهای که کل مناطق تهران و تمام اقشار را در بر گیرد. از افرادی که در مناطق جنوبی تهران هر روز از مترو و بیآرتی استفاده میکنند تا افرادی که از نظر اقتصادی در سطح بالاتری قرار دارند و در مناطق شمالی شهر تهران زندگی میکنند. پرسشنامه باید بین همهی این افراد توزیع شود و متغیرهایی مانند جنسیت، شغل و سن هم در نظر گرفته شود تا بتوانیم به این پرسش پاسخ دهیم که افراد معمولا از چه وسیلهای استفاده میکنند.
برای این کار به جامعهی آماری بسیار بزرگی نیاز داریم؛ زیرا هرچه جامعهی آماری بزرگتر باشد، اعتبار نتایج بیشتر خواهد بود. اما زمانی که از دادههای دیجیتال استفاده میکنیم، میتوانیم دادههای کارتهای مترو یا شرکتهای حملونقل اینترنتی را بررسی کنیم. در این حالت دادههای ما بهروز و هر لحظه در دسترس هستند (به شرط فراهم بودن زیرساختها) و فراگیرند؛ بنابراین نیازی به آمارگیری نیست. برای نمونه، ساعت ۷:۵۸ صبح تعداد مشخصی از افراد کارت مترو زدهاند و از یک ایستگاه وارد و از ایستگاه دیگر خارج شدهاند. در مورد تاکسیهای اینترنتی هم به همین شکل است. در نتیجه الگوهای رفتاری به شکلی بسیار جامعتر در اختیار ما قرار میگیرند.
در این روش دیگر نیازی به طراحی پرسشنامه، ورود دستی دادهها و تحمل محدودیتهای زمانی و انسانی نیست. اینجاست که اصطلاح «میکروسکوپ با وضوح بالا» معنا پیدا میکند؛ یعنی دادههای دیجیتال این امکان را میدهند که با جزئیات فراوان به رفتارها نگاه کنیم و در عین حال آنها را در سطح گستردهای از جامعه بررسی نماییم.
این دادهها پویا، بهشدت منعطف و بهروز هستند و مبتنی بر واقعیت هستند. در حالیکه در پرسشنامهها ممکن است افراد بهویژه در موضوعات حساس مانند مسائل مربوط به حریم خصوصی، جنسیت، عاطفه یا دیدگاههای سیاسی پاسخهای واقعی ندهند، دادههای دیجیتال عملکرد واقعی افراد را نشان میدهند و مشکل اعتبار در آنها وجود ندارد.
موبایل دیگر صرفا یک ابزار ارتباطی ساده نیست؛ بلکه ابزاری چندکارکردی است. هرچند بحثهای اخلاقی دربارهی حریم خصوصی وجود دارد، اما در سطح کلان میتوان از دادههای موقعیت مکانی افراد استفاده کرد تا نقاط مختلف شهری را در ساعات گوناگون بررسی و بر اساس آن سیاستهای حملونقل را برای همان ساعات اعمال کرد. همچنین از طریق سفارشهای غذایی میتوان دریافت افراد در مناطق مختلف، با توجه به جنسیت، سن و طبقهی اقتصادی، چه نوع غذاهایی سفارش میدهند. یا میتوان فهمید شهروندان در روزهای تعطیل به کدام مناطق سفر میکنند و در شبها کدام بخشهای تهران بیشترین فعالیت را دارد.
کنشهای ساده در فضای مجازی مانند کامنت و لایک نیز همچون یک سیستم عصبی برای شهر عمل میکنند. ما باید متناسب با موضوع، انواع دادهها را استخراج و تحلیل کنیم. این همان چیزی است که در ادبیات به آن «نظرسنجی همواره فعال» (always active survey) گفته میشود؛ ابزاری که نشان میدهد افراد در هر لحظه چه کنشهایی انجام میدهند. مثلا در موضوع آلودگی هوا چه نظراتی مطرح میشود، چه احساساتی غالب است، چه کسانی مقصر شناخته میشوند و مردم چه راهکارهایی پیشنهاد میدهند.
این امر اهمیت زیادی دارد؛ زیرا چنین ظرفیتی در نظرسنجیهای سنتی وجود ندارد. آنچه در سیاستگذاری، بهویژه در جوامعی مانند ایران که همواره با بحرانهای چندوجهی روبهرو هستند، اهمیت دارد آنیبودن سیاستگذاری است. یک اظهار نظر ساده یا یک کلیپ میتواند در مدت کوتاهی فردی را از جایگاه بالا به پایین بکشد و تحت فشارهای مختلف قرار دهد. در چنین شرایطی، رصد دادهها نشان میدهد چه گروههایی چه واکنشهایی داشتهاند، چه تیپهایی واکنش مثبت و چه تیپهایی واکنش منفی نشان دادهاند.
اگر بخواهم بهعنوان سیاستگذار فرهنگی عمل کنم و بخواهم پیمایش انجام دهم، این فرآیند دستکم یک ماه زمان میبرد. اما اکنون میتوانیم با رصد دادهها بفهمیم چه گروههای سیاسی، اجتماعی و فرهنگی چه واکنشی به یک رویداد داشتهاند و مهمتر از آن، این واکنشها چه تغییراتی کرده است.
در سنگاپور نمونهای وجود دارد که از طریق دادههای هندزفری انجام شده است. الگوریتمی طراحی شد که الگوهای سرفه و تنفس افراد را استخراج میکرد. اگر فردی طی ده سال از هندزفری استفاده کرده و دادههای او ذخیره شده باشد، الگوریتم میتواند در مواجهه با سرفهی جدید همان فرد یا فرد دیگری تشخیص دهد که این سرفه ناشی از مشکل ریوی، حساسیت، سرماخوردگی یا حتی بیماری مهلکی مانند سرطان است
روشهای محاسباتی مانند مدلسازی شبکه یا شبیهسازی عاملمحور چگونه میتوانند برای تحلیل این رفتارها به کار گرفته شوند؟
ما میتوانیم الگوریتمهای بسیار گستردهای از وضعیت حملونقل و رفتارهای اجتماعی افراد به دست آوریم، بدون آنکه نیاز به طراحی پرسشنامه و ورود دستی دادهها داشته باشیم. انواع دادهها از کارتهای مترو و تاکسیهای اینترنتی گرفته تا موقعیتهای مکانی و سفارشهای غذایی همگی در دسترس و بهروز هستند. این دادهها را میتوان استخراج و تحلیل کرد و متناسب با موضوع، الگوهای رفتاری را بازسازی نمود.
آیا این تحلیلها میتوانند به پیشبینی تغییرات رفتاری در آیندهی شهر کمک کنند؟
بله. مسئله بسیار مهمی که وجود دارد این است که ما در حوزهی داده و بیگدیتا هنوز در آغاز راه هستیم و مسیر طولانی در پیش داریم. پیمایشها بیش از صد سال است که در علوم اجتماعی بهطور علمی انجام میشوند و اکنون به پختگی رسیدهاند، اما در حوزهی دادههای جدید با ابعاد و امکانات تازهای روبهرو هستیم.
برای مثال، در سنگاپور نمونهای وجود دارد که از طریق دادههای هندزفری انجام شده است. الگوریتمی طراحی شد که الگوهای سرفه و تنفس افراد را استخراج میکرد. اگر فردی طی ده سال از هندزفری استفاده کرده و دادههای او ذخیره شده باشد، الگوریتم میتواند در مواجهه با سرفهی جدید همان فرد یا فرد دیگری تشخیص دهد که این سرفه ناشی از مشکل ریوی، حساسیت، سرماخوردگی یا حتی بیماری مهلکی مانند سرطان است.
در چنین حالتی میتوان از طریق ابزارهایی مانند ساعت هوشمند یا تلفن همراه به فرد هشدار داد که این مدل سرفه احتمالا ناشی از بیماری خاصی است. برای سیاستگذار حوزهی بهداشت این امکان فراهم میشود که با نخستین نشانهها، فرد را به بیمارستان هدایت کند. این هشدارهای اولیه، اگر بهطور مکرر داده شوند، میتوانند سرعت تشخیص بیماری را افزایش دهند. در مورد بیماریهایی مانند سرطان، هرچه زودتر تشخیص داده شود، هم احتمال زندهماندن فرد بیشتر میشود و هم هزینههای درمانی کاهش مییابد.
در مدلهای سنتی، افراد معمولا زمانی به پزشک مراجعه میکردند که بیماری به مراحل پیشرفته رسیده بود و علائم شدیدتر شده بود. در این حالت احتمال بقای فرد کمتر و هزینههای درمان برای نظام سلامت کشور بسیار سنگینتر بود.
در فرآیند کار با این دادهها، مسئلهی حریم خصوصی چه جایگاهی دارد و چگونه باید بهطور علمی مدیریت شود؟
بحثهای اخلاقی متعددی دربارهی حریم خصوصی وجود دارد. ممکن است افراد، بهویژه در موضوعات حساس، پاسخ دقیقی ندهند. اما در دادههای دیجیتال ما با عملکرد واقعی افراد مواجه هستیم و مشکل اعتبار پاسخها کمتر مطرح میشود.
با این حال محدودیتهایی هم وجود دارد. برخی از افراد کشور ما به فضای مجازی یا تلفن همراه هوشمند دسترسی ندارند. بسیاری از روستاییان یا افراد مسن در این گروه قرار میگیرند. مسئلهی حریم خصوصی ابعاد گستردهای دارد و در برخی موارد کمیسازی رفتارهای انسانی میتواند گمراهکننده باشد.
در نهایت، آیا تحلیل محاسباتی رفتار شهروندان میتواند منجر به سیاستگذاری هوشمند و منعطفتر شود؟
بهطور کلی دادههای موبایل و بیگدیتا این امکان را برای سیاستگذار و جامعهشناس فراهم میکنند که بهصورت لحظهای، در مقیاس بزرگ و مسئلهمحور به دادهها دسترسی داشته باشند و رفتارها را مانند الگویی زنده بررسی کنند.
در جوامعی مانند ایران که همواره با بحرانهای چندوجهی روبهرو هستند، آنیبودن سیاستگذاری اهمیت ویژهای دارد. یک اظهار نظر ساده یا یک کلیپ میتواند بهسرعت فردی را از بالا به پایین بکشد و او را تحت فشارهای مختلف قرار دهد. دادههای دیجیتال به ما نشان میدهند چه گروههایی چه واکنشهایی داشتهاند، چه تیپهایی واکنش مثبت و چه تیپهایی واکنش منفی نشان دادهاند.
اگر بخواهم بهعنوان سیاستگذار فرهنگی عمل کنم و پیمایشی انجام دهم، این فرآیند دستکم یک ماه زمان میبرد. اما اکنون میتوانیم با رصد دادهها بفهمیم چه گروههای سیاسی، اجتماعی و فرهنگی چه واکنشی داشتهاند و این واکنشها چه تغییراتی کرده است.
این دادهها پویا، منعطف و مبتنی بر واقعیت هستند. ما هنوز در آغاز مسیر داده و بیگدیتا هستیم و راهی طولانی در پیش داریم. پیمایشها بیش از صد سال است که در علوم اجتماعی انجام میشوند و به پختگی رسیدهاند، اما امروز با ابعاد و امکانات تازهای روبهرو هستیم.
انتهای پیام/