راستی‌آزمایی ادعای تقلب در انتخابات با قانون «بن‌فورد»

در این وضعیت کشور موضوع‌های مهم‌تر وجود دارد که بایسته است به آن‌ها پرداخته شود. از این‌رو اصلا قصد نداشتم به این موضوع بپردازم. برخی از پژوهشگران ارجمند خواستند ولو به اجمال ادعای تقلب در انتخابات بر مبنای قانون بن‌فورد را تبیین کنم. این نوشته برای راستی‌آزمایی یا سنجش اعتبار قانون بن‌فورد برای تشخیص تقلب در هر انتخابات است.

۱- دو روزی است که گزارشی درباره‌ی تقلب در انتخابات ریاست جمهوری 1403 ایران منتشر شد. در این گزارش ادعا شد که داده‌های آماری انتخابات مذکور مطابق مدل بن‌فورد- موسوم به قانون بن‌فورد (Benford’s Law)- نیست. بر حسب این ادعا، عدم تطابق نشان‌دهنده‌ی تقلب در انتخابات ۱۴۰۳ و جعلی بودن داده‌های آن است. البته مدعی مشخص نکرد که نتایج مرحله اول یا دوم مورد نظر وی بود. همچنین، مدعی از درستی قطعی قانون بن‌فورد در تشخیص داده های جعلی گفت ولی از ناتوانی‌های آن نگفت. در این خلاصه، ادعای یادشده تبیین شود.

۲-قانون بن‌فورد در سال1881 توسط سایمون نیوکومب ابراز شد و سپس توسط فرانک بن‌فورد که یک فیزیکدان نجوم بود در 1935 ابراز و گسترش یافت. سادگی مدل سبب شد که اقبال و کاربردهای عدیده بیابد و به عنوان یکی از ابزارهای سنجش داده‌های تقلبی و جعلی مطرح شود.

۳- قانون بن‌فورد یک رابطه‌ی ریاضی اثبات نشده ی تجربی است که مدعی است که احتمال بین هر دو رقم متوالی در اعدا د غیرجعلی را به دست می‌دهد.

۴- بر حسب قانون بن‌فورد احتمال وقوع هر عدد 1 تا 9 در رقم اول سمت چپ عددهای واقعی به ترتیب از 1 تا 9 کاهش می‌یابد. بنا بر این، احتمال وقوع عدد یک به عنوان اولین عدد به احتمال 30.1 درصد است و عدد 2 به احتمال 17.6 درصد و هکذا در نهایت عدد 9 به احتمال 4.6 درصد.

۵- قبلا نتایج انتخابات ریاست جمهوری ایران در سال 1388 ایران و نیز نتایج انتخابات سال 2020 ریاست جمهوری آمریکا در شهر شیکاگو و ایالت میلواکی نیز با این قانون آزموده شد و مطابق آن نبود. یعنی بر حسب مدل بن‌فورد در آن دو انتخابات ریاست جمهوری ایران و آمریکا باید تقلب شده باشد.

۶-در ایران مقالاتی که در نقد و ارزیابی آن ادعا ارایه شده باشد را به یاد ندارم. ولی درخوری و توانایی قانون بن‌فورد برای تشخیص تقلب در انتخابات در برخی مقالات علمی جهان نقد و ارزیابی شده است (علاقمندان می توانند این مقالات را در وب بیابند).

۷- درخوری و توانایی قانون بن‌فورد به چند روش زیر ارزیابی شده است:

۷-۱- آزمون قانون بن‌فورد با داده های واقعی غیرجعلی. قانون بن‌فورد به خطا داده‌های واقعی زیر را تقلبی تشخیص داد:
– شماره های تلفن یک شرکت تلفن
– مجموعه ای از نتایج آزمایشگاهی آسیب شناسی،
– فهرست بزرگی از قیمت‌های کالاها،
– آمارهای جمعیتی مجموعه‌ای از محلات آمریکا.
این ها داده‌های واقعی بودند، ولی بر حسب قانون بن‌فورد، تقلبی تشخیص داده شد.

۷-۲- سنجش قانون بن‌فورد با توابع توزیع آماری مرسوم. معلوم شد که اگر تابع توزیع احتمال یا تابع چگالی احتمال متقارن باشد، قانون بن‌فورد در تشخیص آن خطا می‌کند و توزیع داده‌های واقعی را تقلبی تشخیص می‌دهد.

۷-۳- سنجش نتایج آزمون‌های آماری مرسوم با آزمون مبتنی بر قانون بن‌فورد. در این بخش به دو آزمون آماری بسیار مرسوم، یعنی آزمون مجذور سای (یا کای اسکوار) و آزمون کولموگروف-اسمیرنوف بسنده می‌کنم. یادآوری می‌شود که این دو روش آزمون همگرا اند، یعنی یکدیگر را تأیید می کنند. حال آن‌که قانون بن‌فورد بر حسب آزمون مجذورسای، کم‌اعتبار و بر حسب کولموگروف-اسمیرنوف برای داده‌ها در اندازه های کوچک معتبر است. این خدشه‌ی عمده‌ای بر استواری قانون بن‌فورد به عنوان یک ابزار معتبر برای تشخیص واقعی بودن داده ها است.

۸-برخی محدودیت های کاربرد قانون بن‌فورد. بر حسب ارزیابی‌های مختلف، در موارد زیر مدل بن‌فورد ناتوان است:

۸-۱- برای داده‌هایی که توزیع متقارن داشته باشد مانند تابع توزیع نرمال

۸-۲- برای داده هایی که در دامنه‌های بزرگ نباشد، مثلا برای انتخابات با چند ده یا چند صد رأی‌دهنده.
(توجه: در این نوشته به اجمال بررسی توانایی قانون بن‌فورد برای سنجش تقلب در انتخابات بسنده شده است. بحث درباره ی مدل بن‌فورد گسترده تر است.)

نتیجه‌ها:
– این نوشته صرفا به توانایی قانون بن‌فورد در تشخیص تقلب در هر انتخابات به طور کلی پرداخته و نشان داده است که آن قانون، ابزاری ناتوان برای تشخیص تقلبی بودن نتایج هر انتخابات است.

– این که پژوهشگری بر مبنای قانون مذکور ادعا کرد که نتایج انتخابات ریاست جمهوری ۱۴۰۳ در ایران تقلبی است، از ابزاری مخدوش بهره گرفته است.

– این که پژوهشگر مذکور ناتوانی‌های قانون بن‌فورد را ذکر نکرد و برای ادعای تقلب، قانون مذکور را برای راستی‌آزمایی همه‌ی داده‌ها معتبر خواند، پژوهشگر دچار آفت پژوهش‌جانبدارانه است. (برای اطلاع بیشتر رجوع شود به سلسله نوشتار درباره ی پژوهش جانبدارانه از نویسنده در RoshangariRRK@)

*عضوهیات علمی دانشگاه صنعتی امیرکبیر

منبع: کانال تلگرامی نویسنده

بیشتر بخوانید:

دور دوم انتخابات «خرده فرصت» یا «کلان تهدید»
راه‌حل نظریه‌پرداز توسعه دانشگاه جان هاپکینز برای تورم ایران
کسانی می خواهند گاو اردک بزاید
همه می بازیم با دروغ و فریب و بی انصافی
انقلاب علمی خاموش و انفعال ما / پیشگامی تولید فکر نیازمند آزاداندیشی از قیدهای تحمیلی است
استالین و پژوهش های جانبدارانه

216216

راستی‌آزمایی ادعای تقلب در انتخابات با قانون «بن‌فورد»

برچسب ها :