数据分析:宾州数据库缺失百万选民投票纪录

文:梅婷

【新唐人北京时间2020年11月25日讯】美国各州州政府对待选举,或多或少都做出拥有透明度的姿态,很多原始数据,官方都愿意主动与民众分享。宾州也不例外,在这个竞选舞弊投诉非常多的州,选民的数据资料也是每星期更新一次,每次需付20美元即可下载。

笔者手上拿到四份分别是11月2日、9日、16日,及23日下载的宾州全部选民名单的资料集快照(dataset snapshot),用以对比分析,探寻舞弊投诉是否在数字库里有具体的体现。

经过比对发现,截至11月20日,宾州数据库中记录参与本次投票的选民人数,与媒体公布的选票总数相差一百多万。

选民数据库资料应与选民总数一致

首先介绍一些基本数字:数据库里包括九百多万行登记选民的资料,每个选民的资料包含153项属性,包括选民编号、人名、地址、党派、学区、选区、每次选举分别采用的方式、纪录更改日等。其中第一个值得注意的是累积投票人总数,这个数据每州的选举数据库都应该有,但可能用不同的方式表达。

例如,内华达州选民登记数据集是截止到11月6日晚间,数据库里看到一栏属性是“选举日”(Election Day),数这一栏有多少个“2020-11-03”就会得到1,394,715个结果,即截至11月6日内华达州已有约139万选民完成了本次投票。11月15日新闻看到有1,405,376人,内华达州这两个数字基本算是吻合的。

又例如,华盛顿州允许邮寄投票,笔者所下载的数据库是截止到11月2日的版本,同样道理,把“最后一次投票”(LastVoted)那栏里的“2020-11-03”都加起来得到3,230,733个结果,新闻报导中参与早起投票的选民则为3,545,289人。也就是说,到11月2日为止,华盛顿州数据库中记载有323万名选民已经投票,与新闻中说的354万人也很接近,十分之一的差距可能来自早晚截止时间不同的差距,属于正常范围内。

州政府或各新闻机构所报告的参加选举的选民总数必须和数据库里算出总数大致一样,这是常识,也是以下要谈论的重点。

宾州数据库一直缺少上百万人投票信息

在宾州的数据库里,在153个属性中,排列#26的属性 Last Vote Date =’2020-11-03’这一栏拥有类似的内容。如下图所示:

11月1日,宾州数据库记录有240万人已投票;11月8日,数据库记录有372万人已投票;11月15日,数据库记录有447万人已投票;11月20日,数据库记录有585万人已投票。(数据来源:宾州政府数据库)

可以看到三星期来累积投票人数是一直在增长,11月1日是2,404,653,11月8日是3,722,445,11月15日是4,472,083,11月20日是5,850,725。

问题来了,以11月15日为例,宾州政府及新闻媒体公布的已投票人数是 6,857,562张选票,其中拜登 3,423,976票,川普 3,354,836票,乔根森(Jo Jorgenson)78,750张。而从数据库里只看到4,472,083人已投票,两份数据相差2,385,479人。如下图所示:

选举结束以后,宾州政府数据库中记录已投票的人数(黄线)与媒体公布的总票数(蓝线)一直有缺口,缺口从11月3日的330万缩小到了20日的100万。(数据来源:宾州政府数据库)

也就是说,到11月15日为止,有238.5万多张选票来路不明,超过三分之一的选票数据库里根本没有纪录。这也佐证了川普竞选团队数据和策略总监马特‧布雷纳德团队(Matt Braynard)在11月16日所描述的宾州现象:他们在大选后调查了1137人,其中超过三分之一的人寄了选票,却无法在政府的验证网页上查到已投票的纪录。

到了11月20日,基本应该已经全部检查完了,这个缺口还是有一百万左右。

当数据库里的总投票数一直严重低于真实的投票数时,意味着什么呢?

重复投票的隐患

这意味着数据库里更新投票日期、拒绝重复投票的功能选择性失效了;或者新闻报道的已投票数据是虚构的,是虚构了上百万张选票。

在这里简单解释一下这“更新投票日期”功能在数据库中的重要性:

正常来说,如果甲投票了,系统扫描进去,数据库更新了他的投票日子。他出去转了个圈又跑回来,想再投一次票,投票系统一检查,“哦,他的投票纪录已更新为‘2020-11-03’了,他已投过票了。”他就不能投票了。

如果三分之一的人在数据库里的“更新投票日”这一功能失效,他们就能重复多次投票,系统会一直接受!这样才能解释:一面是1137人,超过三分之一的人寄了选票,却在数据库里查不到他们自己已投票(投票日期没有更新),而另一面州政府那里点票比数据库里多出了超过百万张选票这种怪异的现象。

将某段时间、某个投票地点、某些选民特定为无需“更新投票日”、这在技术设置层面是非常容易做到的,但这是有差别地对待选民,是违反选举法的。也使得不法选票可以多次扫入,不被系统拒绝!可以说这是不法选票混入合法选票的通道。

当然,笔者是在做数据库走向和其功能分析,这里技术失误是应该被考虑到的。例如,当机、程序故障、操作不当等,一切技术失误都可能造成数据的错乱和丢失,这时数据库高级管理人员应该立即通知选民暂停选举,维修后再重选。可是我们没有查到有这样的通知。我们有理由怀疑这多出的上百万张选票中有很多是来路不明的。

“邮寄选票数据集”已做篡改

鉴于宾州政府在《大纪元时报》发表的《宾州选票数据疑点浅析 220岁老人邮寄投票》这篇文章见报后,将该文中公开的“邮寄选票数据集”已做篡改,并且不让公众再去下载。再过一两个星期本文所述的这个数字缺口很可能又会被修补上了。

由此,笔者对宾州政府及其数据库高级管理人员提出的问题是:你们在大选前后这一个月以来,用什么机制保证不混入重复选票的?这是个永恒的问题,不是个通过补上数据就能解释的问题!

假设重新计票,必须用独立的扫描器记录所有重新计票的选票上的选民编码,只要出现重复的选票,就立即作废。最后若发现合法选票大大少于公布的数据690万,笔者绝不会吃惊。因为现在宾州数据库的走势就是这么荒诞。

笔者非常鼓励专业数据人士去研究各选举问题州的数据库,发现事实真相找出问题所在。鼓励下载,留下证据。

每份$20元的宾州官方注册选民资料集:

https://www.pavoterservices.pa.gov/Pages/PurchasePAFULLVoterExport.aspx

(转自大纪元/责任编辑:李红)

相关文章
评论