ベンフォードの法則は米国大統領選挙の不正を証明しているのか?

ビッグデータ

1.ベンフォードの法則は米国大統領選挙の不正を証明しているのか?まとめ

・米国大統領選挙の投票数がベンフォードの法則に従っていないと不正選挙を疑う人達がいる
・ベンフォードの法則の専門家が選挙結果にベンフォードの法則を適用する事の問題点を指摘
・選挙で最初の桁を分析しても機能しない事は十数年にわたる研究の結果、既にわかっている

2.ベンフォードの法則とは?

以下、jengolbeck.medium.comより「Benford’s Law Does Not Prove Fraud in the 2020 US Presidential Election」の意訳です。元記事の投稿は2020年11月11日、Jen Golbeckさんによる投稿です。

ベンフォードの法則は自然界の様々な数を構成する1~9の数字は一定の偏りをもって出現するという経験則ですが、それを使ってアメリカ大統領選挙に不正があった事を確かめられるとの主張が11月上旬くらいに結構アメリカで流行ったようで、それらの主張に対してベンフォードの法則を専門にしている方からの指摘です。

アイキャッチ画像のクレジットはPhoto by Nikita Kachanovsky on Unsplash

2020年の米国大統領選挙をきっかけに、数学を使って投票に不正があったことを証明できると人々が主張しているところを見たことがあるかもしれません。

彼らは間違っています。その理由を説明するためにあなたは本投稿を共有する事ができます。

配信予告:RadioLabは本件に関して非常に優れた配信を行いました。この中には、私とミシガン大学で選挙分析を行ったMebane博士へのインタビューなど、以下の多くの内容が含まれています。それらを全て読みたくない場合は、www.wnycstudios.orgでpodcastを聞いてください。

私はベンフォードの法則(Benford’s Law)、不正を主張する人達が話している統計パターンに関する研究の専門家です。彼らがなぜその使い方を間違ったのか、そしてなぜ彼らがそれを正しく行ったとしても、それが詐欺の証拠とはならないのかをお話します。

ベンフォードの法則では、基本的に「一部の自然発生システムの数字の最初の桁は一定のパターンに従う」とされています。

直感的には「1で始まる数字」は、「9で始まる数字」と同じくらい一般的であると感じるかもしれませんが、多くのシステムでは、数字の約30%が1で始まり、頻度は、9で始まる数字の5%程度まで低下します。

この法則は至る所で見られます!

私はベンフォードの法則をソーシャルネットワークの友達数に適用し、ボットの検出に使用できる事を示しました。財務および会計の調査で使用され、詐欺の証拠として法廷で使用することもできます。地球上のすべての川の長さはこのパターンに従います。原子質量。JPEG係数。驚異的です!

ベンフォードの法則についてもっと知りたい場合は、NetflixにConnectedというシリーズがあり、エピソード4(Digits)が全てです。私はそのドキュメンタリーに出演しているので、あなたのテレビ画面に私が出現したら気軽に挨拶してください。

訳注:邦題は「ビッグデータ黄金時代: 世界の繋がりを科学する」で第四話「桁と数字の法則」です。

このドキュメンタリーのせいか、「各選挙区から投票数を取得し、一桁目の分布を見れば、不正が行われたかを確認できる!」と多くの人が言っています。

それは上手くいきません。

ベンフォードの法則が不正選挙の検出に使用できるかどうかは、十数年にもわたって研究されてきました。これを研究する誰もが知っていることは、最初の桁を分析しても絶対に機能しないということです!何故でしょうか?

まず、各選挙区の大きさはある程度の範囲内に収まっており、桁違いに大きな広がりがあるわけではありません。ベンフォードの法則が適用されるほとんどの場所では、10代、100代、1,000代、10,000代などの桁が異なる数字があります。選挙区は全ての票を数えるために、出来る限り巨大にしたくないので、桁が違う程の変化はありません。 これはベンフォードの法則に対するストライキの1つです。

次に、これは非常に重要です。選挙区での投票は、この選挙では(基本的に)2人の候補者に分割されます。(第三候補の候補者は、この点では問題にならないほど小さな割合でしかありません)。トランプがX票を獲得した場合、バイデンは(基本的に)総投票数 – Xを獲得します。

全ての地区に1,000人がいるとしましょう。トランプの得票数がベンフォードの法則に従う場合、バイデンの得票数はベンフォードの法則に従う事はできません。トランプの投票数の約30%が1で始まり、バイデンが残りを取得した場合、バイデンの投票数の30%は8または9で始まります。(例えば、トランプが175票を獲得したら、バイデンは1000–175 = 825を獲得します)。

選挙区はすべて同じサイズではありませんが、一方の番号がもう一方の番号に依存しているという事実は、ベンフォードの法則の根本に違反しています。(独立性が必要です)。直感的には、合計を分割するという事は、両方の候補者を特定のパターンに従わせる事が難しい事を意味するとわかると思います。

第三に、私達はこれを研究した事があります。私達はそれが機能しないことを知っています。過去の選挙のデータを共有する人もいるかもしれませんが、世界中の選挙を調査する研究が十数年にわたって行われており、ベンフォードの法則を最初の桁に適用する分析は機能しませんでした。証明終わり。

Wikipediaの記事を読んでExcelにいくつかの数字を入力して検証したつもりになった全ての人々は、私が上で概説した事をやっています。これが機能しない事はわかっています。彼らは嘘をついています。単に誤った情報を与えられているだけではないのです。

私達の多くは、過去5日間、彼らの手法の誤りを精力的に修正してきましたが、彼らはそれを続けています。彼らはそれが機能しないことを知っています。論文は全て公開されており、入手可能です。彼らは気にしません。彼らの議論をふっかける目的には良いのでしょう。彼らはあなたをだまそうとしています。

さて、ベンフォードの法則が機能しない場合、なぜそれについて何十年もの研究があるのでしょうか?

それらの研究では、多くの場合、予想されるパターンに従う2桁目の分布を調べています。それは選挙不正を検出するのにうまく機能するでしょうか?

いいえ、素晴らしい事ではありませんが、機能しません。

私は幾つかのケースでそれを行うことができますが、多くの場合、失敗をします。このトピックに関する論文からの引用は次のとおりです。

「ベンフォードの法則は、選挙結果に用いた場合、法廷で使用可能なツールとしては問題があります…どちらの方法でも「成功率」は本質的にコイントスと同等であり、それによって法廷での使用には問題があり、最悪の場合は完全に誤解を招きます。」
出典:Deckert, Joseph, Mikhail Myagkov, Peter C. Ordeshook.「Benford’s Law and the detection of election fraud.」 Political Analysis 19.3 (2011)」

これに関する研究は常に例外でいっぱいです。体系的な詐欺がなかったことがわかっている場所もありますが、そこでの数字はベンフォードの分析で予想される2桁目の数字とは分布が異なりました。

私達はこれについて知っており、それが失敗する理由を調べています。失敗する理由は今回の議論にとってあまり興味深い事ではないと思いますが、私は以下だけを言っておきます。単純に2桁目の分析を行うだけでは、完全に信頼できる手法を使用している事にはなりません。

しかし、あなたはこんな例外については気にしないでしょうか?
2桁目の数字についてベンフォードの法則を使って分析をやってみますか?

すごい!しかし、実はそれをする必要はありません!

ベンフォードを使用して選挙を分析することに関する第一人者の一人であるWalter Mebaneが既にそうしています。

彼の論文はwww-personal.umich.eduで公開されています。

論文のタイトル?
「Inappropriate Applications of Benford’s Law Regularities to Some Data from the 2020 Presidential Election in the United States(米国の2020年大統領選挙の一部のデータへのベンフォードの法則の不適切な適用)」です。

彼はデータを適切に使って2桁目の数字について有効なベンフォード分析を行い、不正の証拠がないことを示しています。

あなたは自分で論文を読みに行くことができます。(これは素晴らしい論文であり、より高度な統計知識を持っていれば非常に読みやすいです。)

従って結論として、
・最初の桁を分析している人々が行っている事は機能しないことが知られています。
・2桁目の分析にはある程度の見込みがあるかもしれませんが、信頼性はありません。

そして、あなたがベンフォードの法則に従うべきと確信しているとしても、それはこの選挙の結果が疑わしいと言う事を何も示していません。

ネット上の伝聞やExcelでグラフを作成する人に騙されてはいけません。

統計は複雑であり、正しく使用するには心得が必要です。このベンフォードの法則の陰謀を吹聴する人々は、それを使用する正しい方法を知らないだけでなく、意図的に不正直です。科学者や統計学者の話を聞いてください。私達の手法は、今回の選挙で詐欺が行われた事の証拠となりません。

3.ベンフォードの法則は米国大統領選挙の不正を証明しているのか?関連リンク

1)jengolbeck.medium.com
Benford’s Law Does Not Prove Fraud in the 2020 US Presidential Election

2)www.wnycstudios.org
Breaking Benford

3)www.netflix.com
ビッグデータ黄金時代: 世界の繋がりを科学する

4)www-personal.umich.edu
Inappropriate Applications of Benford’s Law Regularities to Some Data from the 2020 Presidential Election in the United States(PDF)

コメント

タイトルとURLをコピーしました