بررسی تحولات توجه عمومی به نامزدهای انتخابات ریاست جمهوری ایران ۱۳۹۶

 تصویر به روز‌رسانی شده در پایان روز پنجشنبه:

Screen Shot 2017-05-19 at 13.35.55.png

با افزایش روزافزون استفاده ما از اینترنت و تکنولوژی‌های مبتنی بر آن بسیاری از مناسبات اجتماعی، اقتصادی، و سیاسی ما دستخوش تغییر شده است. به طور خاص فعالیت‌های سیاسی و مشارکت مدنی شکلی کاملا متفاوت به خود گرفته است. اگر در گذشته فعالیت سیاسی مستلزم عضویت رسمی در یک حزب و یا شرکت در یک تجمع و یا همایش و همراه با صرف زمان و انرژی می‌بود، امروزه مشارکت سیاسی می‌تواند حتی تنها با لمس صفحه گوشی تلفن همراه و از طریق به اشتراک گذاشتن یک تصویر در چت‌افزار تلگرام صورت بگیرد. من و همکارانم در کتاب “تلاطم سیاسی، چگونه رسانه‌های اجتماعی کنش‌های جمعی را شکل می‌دهند” استدلال می‌کنیم که نقش رو به رشد رسانه‌های اجتماعی در فعالیت‌های سیاسی منجر به غیرقابل پیش‌بینی‌شدن بیش از پیش رخدادهای سیاسی می‌شود. اتفاقاتی که در حدود دو سال اخیر در کشورهای مختلف رخ داده‌اند در کنار وقایع مرتبط به بهارعربی بهترین مثال‌ها برای غیرقابل پیش‌بینی بودن سیاست در دنیای برخط امروز هستند.

نظرسنجی‌ها که در طول سالیان دراز متداول‌ترین روش سیاست‌سنجی بوده‌اند اعتبار خود را از دست داده‌اند. در انتخابات‌های مختلف اخیر، پیروزی نامزدهایی که از پیشینه سیاسی ضعیفی برخوردار بودند و یا از حمایت حزبی خاصی بهره نمی‌بردند و در نظرسنجی‌ها کمترین شانسی برای پیروزی داشتند، تمامی معادلات سیاسی در دموکراسی‌های کهن را به هم ریخته است. شکست سنگین حزب کارگر در انتخابات عمومی سال ۲۰۱۵ در بریتانیا که در نهایت منجر به برگزاری رفراندوم خروج از اتحادیه اروپا و ترک اتحادیه توسط بریتانیا شد را هیچ یک از نظرسنجی‌ها پیش‌بینی نکرده بود، و مثال‌های متعدد دیگر. در عین حال، همان تکنولوژی‌های اینترنتی که سیاست را دگرگون کرده‌اند، فرصت‌های جدیدی برای سنجش افکار عمومی در اختیارمان قرار می‌دهند. امروزه به جای اینکه مجبور باشیم با تماس تلفنی و یا به صورت میدانی از نظر افراد و یا گرایش سیاسی‌شان مطلع شویم، می‌توان با بررسی و تحلیل داده‌های زیادی که در فضای مجازی تولید می‌شود، تصویر دقیقی از تحولات توجه عمومی، گرایش‌های سیاسی، دغدغه‌های جمعی و در نهایت اقبال و محبوبیت عمومی سیاستمدران به دست آورد.

به عنوان مثال، در انتخابات ریاست جمهوری سال ۱۳۹۲ که منجر به پیروزی حسن روحانی شد، کمتر نظرسنجی‌ای پیروزی یک مرحله‌ای حسن روحانی را پیش‌بینی می‌کرد. در شکل زیر اما می‌توان میزان جستجوی نام نامزدها و تعداد بازدیدهای روزانه از صفحات مربوطه در ویکی‌پدیا را در دوره‌ای یک ماهه منتهی به روز انتخابات مشاهده کرد که به وضوح رشد توجه عمومی به حسن روحانی در سه روز منتهی به انتخابات را نشان می‌دهند.

Screen Shot 2017-05-16 at 22.41.05

اگرچه میزان آرا را نمی‌توان به سادگی از این‌دست داده استخراج کرد، اما تحول زمانی میزان توجه و اقبال عمومی را می‌توان تا حد قابل ملاحظه‌ای سنجید. در پروژه‌ای قدیمی‌تر با استفاده از همین نوع داده‌ها و با استفاده از مدلسازی ریاضی توانسته‌ایم میزان فروش فیلم‌های سینمایی را حتی از یک ماه قبل از شروع اکران با دقت بالایی پیش‌بینی کنیم. البته در مورد انتخابات، عدم در دست بودن نمونه‌های کافی و فاصله زمانی طولانی بین دوره‌های انتخابات، پیش‌بینی دقیق را نامیسرمی‌کند. در این مقاله بحث می‌کنیم که چرا از تغییرات نسبی (و نه مقدار مطلق) میزان توجه عمومی به یک نامزد می‌توان به عنوان مقیاسی از محبوبیت وی و در نهایت تعداد آرایی که بدست می‌آورد استفاده کرد. از توضیح مبسوط این موضوع در این متن خودداری می‌کنم. به طور خلاصه اما دلیل این موضوع به این برمی‌گردد که عموما افراد موقعی به کسب اطلاع اقدام می‌کننند که قصد تغییر یا تثبیت رای خود را دارند.

بعد از این مقدمه نسبتا طولانی، بیایید نگاهی به انتخابات آتی ریاست جمهوری ایران بیندازیم. در نمودار زیر میزان بازدید روزانه از صفحات ویکی‌پدیا مربوط به ۴ نامزد اصلی در طول یک ماه منتهی به انتخابات تا دیروز (دوشنبه قبل از انتخابات) تا پایان روز سه‌شنبه قبل از انتخابات را می‌بینیم. خطوط سیاه عمودی تاریخ مناظره‌های تلویزیونی را نشان می‌دهند.

Screen Shot 2017-05-17 at 18.19.00

نکات جالبی را می‌توان در این نمودار مشاهده کرد.

۱) تا قبل از مناظره اول ابراهیم رئیسی بیشترین میزان توجه را به خود جلب کرده است. شاید مهمترین دلیل ناشناخته بودن وی باشد. معمولا اقبال یه سوی نامزد و یا حزب جدید و ناشناخته ناشی از عدم رضایت از وضع موجود و اعتماد به سیاستمداران شناخته شده‌تر است.

۲) در طول مناظره اول، اسحاق جهانگیری توجه زیادی را به خود جلب کرد. حملات پیاپی وی به رقبا و دفاع سرسختانه وی از دولت یازدهم در طول مناظره اول دلیل اصلی این پدیده است.

۳) رئیسی که در مناظره اول چندان فعال نبود جایگاه خود را به جهانگیری و قالیباف می‌دهد و در رتبه سوم می‌ایستد.

۴) رفته رفته با نزدیک شدن به مناظره دوم، توجهات از هر سه نامزد رقیب کاسته شده و به سمت رئیسی باز می‌گردد و اینبار در مناظره دوم (که کم‌اقبال‌ترین مناظره هم بوده است) رئیسی و جهانگیری میزان توجه یکسانی را جلب می‌کنند.

۵) در فاصله زمانی بین مناظره دوم و مناظره سوم اتفاق چندانی رخ نمی‌دهد جز اینکه روحانی به واسطه سخنرانی نسبتا تند خود در همدان  خود را بالا کشیده و بعد از رئیسی در جایگاه دوم قرار می‌گیرد.

۶) در مناظره سوم اما این رئیسی و قالیباف هستند که با حملات پیاپی و با طرح پرونده‌های فساد اقتصادی توجه‌ها را به سمت خود جلب کرده و رتبه‌های اول و دوم را از آن خود می‌کنند.

۷) در نهایت انصراف قالیباف در روز دوشنبه می‌تواند دلیل افزایش توجه به رئیسی در آخرین نقاط از این نمودار باشد.

حالا بیایید نگاهی بیندازیم به مناظره سوم و انصراف نامزدهای کمکی (قالیباف و جهانگیری). برای بررسی این اتفاقات به میزان جستجوی نام نامزدها در گوگل توجه می‌کنیم. استفاده از داده جستجوهای گوگلی به ما این اجازه را می‌دهد که تحولات را ساعت به ساعت بررسی کنیم.

Screen Shot 2017-05-16 at 23.20.50

دو خط سیاه عمودی زمان شروع و پایان مناظره سوم و خط‌های رنگی زمان اعلام انصراف هر دو نامزد را نشان می‌دهند.

۱) اگرچه حملات سه‌گانه جهانگیری که با حمله شدید وی در ابتدای مناظره شروع شد توجه زیادی را به خود جلب کرد، اما این قالیباف بود که در میانه مناظره توانست جریان توجهات را به سمت خود برگرداند و در نهایت در دور پایانی از فرصت  خود ضربه نهایی را وارد کند.

۲) انصراف قالیباف در بعدازظهر روز دوشنبه را شاید بتوان بهترین تاکتیک اردوگاه اصولگرایان دانست. حجم توجهی که قالیباف به خود و در نهایت به سمت رئیسی جلب کرد حتی از میزان توجهی که در طول مناظره به وی شد بیشتر است. انصراف قالیباف نه تنها حجم بالایی از رای وی را به رئیسی منتقل می‌کند، بلکه این هیجان مضاعف می‌تواند رای‌های مردد و یا رای‌های روحانی را نیز به سمت رئیسی متمایل کند.

۳) انصراف جهانگیری در روز سه شنبه از آن سو میزان هیجان بسیار کمی ایجاد کرد (نقاط پایانی نمودار بالا).

کلیدواژه‌ها

یکی از تاکتیک‌های اصولگرایان در این انتخابات کلیدواژه‌سازی بود. تاکید قالیباف به “چهاردرصدی‌ها” شاید بهترین مثال باشد. اما در این میان، جنجال مربوط به سند ۲۰۳۰ یونسکو شاید بزرگترین بدشانسی روحانی بود. چنانکه در نمودار زیر می‌بینیم، جستجوی این کلیدواژه از تمامی کلیدواژه‌های دیگر بیشتر بوده است. هرچند به سند ۲۰۳۰ در مناظره‌ها اشاره‌ای نشد، اما تبلیغات میدانی اصولگرایان تمرکز زیادی روی این موضوع داشت.

Screen Shot 2017-05-16 at 22.09.14

نگاهی به توزیع جغرافیایی جستجو “سند ۲۰۳۰” نیز خالی از لطف نیست.

Untitled.png

در دور اول انتخابات سال ۱۳۸۴ محمود احمدی‌نژاد در هر سه استانی که بیشترین میزان جستجوی این کلیدواژه را داشته‌اند، بیشترین میزان رای را داشت. این نتایج میزان موفقیت در نفوذ دادن این کلیدواژه در بین استان‌های اصولگرا را نشان می‌دهد.

در بالا به ضعف نظرسنجی‌های سنتی اشاره کردیم. به ویژه با توجه به مسائل فرهنگی، اجتماعی و سیاسی در ایران، میزان قابل اتکا بودن این دست نظرسنجی‌ها در مقایسه با کشورهای غربی حتی کمتر هم است. با این همه، بیایید نگاهی به یکی از نظرسنجی‌هایی که در بحث‌ها به آن استناد زیادی می‌شود بیندازیم.

نظرسنجی‌های ایپپو (IPPO) که در این سایت قابل دسترسی هستند ظاهرا از طریق تماس تلفنی تصادفی صورت گرفته‌اند. اطلاعات کمی راجع به روش نظرسنجی و گروه مجری ارائه شده است.

تصویر زیر نتایج اصلی ایپپو را نمایش می‌دهد. بر مبنای این تصویر پیروزی یک مرحله‌ای روحانی تضمین شده است. اما یک ستاره کوچک و یک پاورقی داستان را عوض می‌کند: این نتایج تنها بر مبنای نظر افرادی هست که به سوال نظرسنجی با نام یکی از نامزدهای شش‌گانه پاسخ داده‌اند.

Screen Shot 2017-05-16 at 23.55.45

اگر به تمامی پاسخ‌ها توجه شود، نتایج به شکل زیر خواهد بود.

Screen Shot 2017-05-16 at 23.58.47

همانطور که ملاحظه می‌کنید، حدود یک چهارم از سوال شونگان در نظرسنجی ایپپو گزینه “نمی‌گویم” را انتخاب کرده‌اند و حدود یک چهارم افراد هم مردد هستند. در واقعی نتایج نمودار اول ایپپو تنها بر اساس نیمی از نظرات اعلام شده است. البته تشخیص رای واقعی افرادی که پاسخ نداده‌اند و یا مردد هستند کار ساده‌ای نیست، اما وجود نسبت بالای جواب‌های غیرقابل تحلیل اعتبار نظرسنجی ایپپو را بیش از پیش زیر سوال می‌برد. سایت ایپو در توصیفی عجولانه مدعی می‌شود که احتمالا درصد زیادی از افرادی که گزینه نمی‌گویم را انتخاب کرده‌اند از طرفداران روحانی هستند و به‌دلیل ملاحظات امنیتی از دادن پاسخ طفره می‌روند. اما در مقابل باید به همبستگی بالای تعداد این افراد و طرفداران رئیسی در نمودار بالا توجه کرد. خطوط سیاه و زرد در بخشهای زیادی از نمودار موازی هستند که این موضوع می‌تواند به یکسان بودن جنس رای هر دو گروه مربوط باشد. علاوه براین، پدیده کاملا شناخته شده “محافظه‌کار خجالتی” پیشنهاد می‌کند که عموما در نظرسنجی‌های رودررو، شانس اینکه افراد با رای محافظه‌کار رای خود را کتمان کنند و یا متفاوت اعلام کنند خیلی بیشتر ازافراد متمایل به گزینه‌های لیبرال است.

هدف اصلی من از نگارش این متن تنها نشان دادن قابلیت‌های داده‌های بزرگ و استفاده از آن‌ها در بررسی تحول عقاید و البته زیر سوال بردن پیش‌بینی‌های مبتنی بر روش‌های سنتی نظرسنجی بود. پیش‌بینی نتایج انتخابات پیش رو کاری سخت است و البته اتفاقات چند روز آینده می‌تواند نقش تعیین کننده‌ای در جهت‌دهی آرا داشته باشد.

پی نوشت: از سودابه میلانی برای پیشنهاد نوشتن این متن سپاسگذارم.

How Big Data will change our lives and our understanding of them

… If the invention of telescopes provided us with the ability to understand how galaxies behave, and the microscope allowed us to find the cure of such a huge amount of diseases, this century we are going to understand much more about the social systems because of big data. There is no doubt that humans are much more complicated than atoms or even planets and stars, but with the help of powerful mathematical tools and our ever-faster computers we will be able to find and reveal the universal laws of human societies in a numerical framework.

… Read More at Dataconomy. 

Image Credit: William Pearce

Breaking news in a connected world

The bitterness of the tragedy is the same, what has changed is the way that information spreads.

I heard about the Boston Marathon Bombing, first when I was preparing to go to bed, and as a recently emerged habit, I was doing my bed-time-Facebook “friend feed” check. The news-line was so shocking that I kept “browsing” for the next few hours. It was quite different to the case of 9/11 attacks when I encountered the story while having my afternoon snack and watching TV in a local snack-bar.

Although it was also hard to believe when I was watching the videos of the smoking buildings on TV some eleven years ago, but this time I was much more suspicious about what I was witnessing on my Facebook friend feed. I thought may be it’s a late arriving “April fool’s joke”! It’s not a totally unreasonable suspicion, given the fact that generally a TV news story is supposed to be much more reliable than a random post by a random guy on his Facebook wall. Then I checked Wikipedia (believe me or not, it’s usually the fastest in such cases, and I don’t have a TV!). I searched for “Boston” in Wikipedia search field and I ended up with a yet very short article titled “2013 Boston Marathon bombings“, and it became quite evident that something nasty has happened.

Although the nature of the terrorist attacks, the emotions involved in and evoked by, the bitterness of the memory, etc, have not changed much during the last decades, but the way of information exposure around these topics, as well as any other “breaking news” has changed dramatically.
The recently developed bottom-up social media offer totally different channels for information dissemination with their own pros and cons.

The rapid spread and deep penetration of information brought up by the social media is undeniable. However, in non-hierarchical structure of news production no one is responsible for the accuracy and correctness of the information, apart from the “citizen journalists” who produce and consume the information at the same time. In addition to that, the type of multimedia materials produced now on breaking news are also significantly different. Most of the videos and photos on such events are produced by “amateur crowed journalists” with their smart phones in hand. However they could draw a fairly accurate and multidimensional picture of the event in an incredibly short time. This could be quite valuable in cases like recent Iran earthquake where much earlier than the official sources could provide information on the casualties and damages caused by the earthquake in rural area and small villages with no official media coverage, you could see dozens of photos and even videos uploaded to the Web.

Publishing uncovered photos of suspects and asking citizens to help the police to spot them is a rather classic method, and has been in use for many years. However, new technologies could again be of great help in this field too. Do not forget that in the case of the marathon bombing, the police tracked the suspects by locating the cell-phone of the driver of the car hijacked by them. I believe this can go much further, remembering that a team from MIT could find 10 red balloons spread over the USA within the 2009 DARPA Network Challenge in less than 9 hours using crowd-sourcing and with the help of around 5000 random participants from public.

Back to the case of natural disasters, when proper distribution of resources and aids within the first few hours after the event, are extremely important and could decrease the casualties significantly, crowd-sourced information could potentially play an important role in assigning priorities and spotting regions in crucial conditions.

A less technically important topic yet with great deal of humanity and emotional aspects of socially connected world of today is the way that social media could provide a common medium to share emotions and sympathies with the people suffered in cases including natural disasters, terrorist attacks and any other of this kind. I remember that in 2001, people in Tehran went to the streets and light candles in memory of the victims of the 9/11 terrorist attack, however I’m not sure whether the suffered families and other USA citizens were exposed to this through the main-stream media. This year it was much easier to send a massage of condolence directly to the attacked nation by using the #preyforbostin “hashtag” in twitter. Therefore it’s no wonder that the hashtags of #preyforboston and #preyforiran, both became “trend” in twitter in mid-April 2013.