در این وضعیت کشور موضوعهای مهمتر وجود دارد که بایسته است به آنها پرداخته شود. از اینرو اصلا قصد نداشتم به این موضوع بپردازم. برخی از پژوهشگران ارجمند خواستند ولو به اجمال ادعای تقلب در انتخابات بر مبنای قانون بنفورد را تبیین کنم. این نوشته برای راستیآزمایی یا سنجش اعتبار قانون بنفورد برای تشخیص تقلب در هر انتخابات است.
۱- دو روزی است که گزارشی دربارهی تقلب در انتخابات ریاست جمهوری 1403 ایران منتشر شد. در این گزارش ادعا شد که دادههای آماری انتخابات مذکور مطابق مدل بنفورد- موسوم به قانون بنفورد (Benford’s Law)- نیست. بر حسب این ادعا، عدم تطابق نشاندهندهی تقلب در انتخابات ۱۴۰۳ و جعلی بودن دادههای آن است. البته مدعی مشخص نکرد که نتایج مرحله اول یا دوم مورد نظر وی بود. همچنین، مدعی از درستی قطعی قانون بنفورد در تشخیص داده های جعلی گفت ولی از ناتوانیهای آن نگفت. در این خلاصه، ادعای یادشده تبیین شود.
۲-قانون بنفورد در سال1881 توسط سایمون نیوکومب ابراز شد و سپس توسط فرانک بنفورد که یک فیزیکدان نجوم بود در 1935 ابراز و گسترش یافت. سادگی مدل سبب شد که اقبال و کاربردهای عدیده بیابد و به عنوان یکی از ابزارهای سنجش دادههای تقلبی و جعلی مطرح شود.
۳- قانون بنفورد یک رابطهی ریاضی اثبات نشده ی تجربی است که مدعی است که احتمال بین هر دو رقم متوالی در اعدا د غیرجعلی را به دست میدهد.
۴- بر حسب قانون بنفورد احتمال وقوع هر عدد 1 تا 9 در رقم اول سمت چپ عددهای واقعی به ترتیب از 1 تا 9 کاهش مییابد. بنا بر این، احتمال وقوع عدد یک به عنوان اولین عدد به احتمال 30.1 درصد است و عدد 2 به احتمال 17.6 درصد و هکذا در نهایت عدد 9 به احتمال 4.6 درصد.
۵- قبلا نتایج انتخابات ریاست جمهوری ایران در سال 1388 ایران و نیز نتایج انتخابات سال 2020 ریاست جمهوری آمریکا در شهر شیکاگو و ایالت میلواکی نیز با این قانون آزموده شد و مطابق آن نبود. یعنی بر حسب مدل بنفورد در آن دو انتخابات ریاست جمهوری ایران و آمریکا باید تقلب شده باشد.
۶-در ایران مقالاتی که در نقد و ارزیابی آن ادعا ارایه شده باشد را به یاد ندارم. ولی درخوری و توانایی قانون بنفورد برای تشخیص تقلب در انتخابات در برخی مقالات علمی جهان نقد و ارزیابی شده است (علاقمندان می توانند این مقالات را در وب بیابند).
۷- درخوری و توانایی قانون بنفورد به چند روش زیر ارزیابی شده است:
۷-۱- آزمون قانون بنفورد با داده های واقعی غیرجعلی. قانون بنفورد به خطا دادههای واقعی زیر را تقلبی تشخیص داد:
– شماره های تلفن یک شرکت تلفن
– مجموعه ای از نتایج آزمایشگاهی آسیب شناسی،
– فهرست بزرگی از قیمتهای کالاها،
– آمارهای جمعیتی مجموعهای از محلات آمریکا.
این ها دادههای واقعی بودند، ولی بر حسب قانون بنفورد، تقلبی تشخیص داده شد.
۷-۲- سنجش قانون بنفورد با توابع توزیع آماری مرسوم. معلوم شد که اگر تابع توزیع احتمال یا تابع چگالی احتمال متقارن باشد، قانون بنفورد در تشخیص آن خطا میکند و توزیع دادههای واقعی را تقلبی تشخیص میدهد.
۷-۳- سنجش نتایج آزمونهای آماری مرسوم با آزمون مبتنی بر قانون بنفورد. در این بخش به دو آزمون آماری بسیار مرسوم، یعنی آزمون مجذور سای (یا کای اسکوار) و آزمون کولموگروف-اسمیرنوف بسنده میکنم. یادآوری میشود که این دو روش آزمون همگرا اند، یعنی یکدیگر را تأیید می کنند. حال آنکه قانون بنفورد بر حسب آزمون مجذورسای، کماعتبار و بر حسب کولموگروف-اسمیرنوف برای دادهها در اندازه های کوچک معتبر است. این خدشهی عمدهای بر استواری قانون بنفورد به عنوان یک ابزار معتبر برای تشخیص واقعی بودن داده ها است.
۸-برخی محدودیت های کاربرد قانون بنفورد. بر حسب ارزیابیهای مختلف، در موارد زیر مدل بنفورد ناتوان است:
۸-۱- برای دادههایی که توزیع متقارن داشته باشد مانند تابع توزیع نرمال
۸-۲- برای داده هایی که در دامنههای بزرگ نباشد، مثلا برای انتخابات با چند ده یا چند صد رأیدهنده.
(توجه: در این نوشته به اجمال بررسی توانایی قانون بنفورد برای سنجش تقلب در انتخابات بسنده شده است. بحث درباره ی مدل بنفورد گسترده تر است.)
نتیجهها:
– این نوشته صرفا به توانایی قانون بنفورد در تشخیص تقلب در هر انتخابات به طور کلی پرداخته و نشان داده است که آن قانون، ابزاری ناتوان برای تشخیص تقلبی بودن نتایج هر انتخابات است.
– این که پژوهشگری بر مبنای قانون مذکور ادعا کرد که نتایج انتخابات ریاست جمهوری ۱۴۰۳ در ایران تقلبی است، از ابزاری مخدوش بهره گرفته است.
– این که پژوهشگر مذکور ناتوانیهای قانون بنفورد را ذکر نکرد و برای ادعای تقلب، قانون مذکور را برای راستیآزمایی همهی دادهها معتبر خواند، پژوهشگر دچار آفت پژوهشجانبدارانه است. (برای اطلاع بیشتر رجوع شود به سلسله نوشتار درباره ی پژوهش جانبدارانه از نویسنده در RoshangariRRK@)
*عضوهیات علمی دانشگاه صنعتی امیرکبیر
منبع: کانال تلگرامی نویسنده
بیشتر بخوانید:
دور دوم انتخابات «خرده فرصت» یا «کلان تهدید»
راهحل نظریهپرداز توسعه دانشگاه جان هاپکینز برای تورم ایران
کسانی می خواهند گاو اردک بزاید
همه می بازیم با دروغ و فریب و بی انصافی
انقلاب علمی خاموش و انفعال ما / پیشگامی تولید فکر نیازمند آزاداندیشی از قیدهای تحمیلی است
استالین و پژوهش های جانبدارانه
216216