大数据可以使一些人成为“低分辨率公民”

大数据

在印度,一个通过指纹和照片识别 12.5 亿居民身份的政府数据库创建了一个官僚基础设施,虽然旨在将边缘化的公民纳入其中,但有时会产生相反的效果。

使用印度基于生物特征的个人识别系统 Aadhaar 作为测试案例,Ranjit Singh 博士和他的合作者、康奈尔·安·S·鲍尔斯计算与信息科学学院信息科学副教授史蒂文·杰克逊研究了该系统如何为该国近 14 亿人口工作。

他们的论文“像基础设施一样看待:低分辨率公民和 Aadhaar 识别项目”于 10 月 18 日发表在人机交互计算机协会会刊上。该论文还在本周的 ACM 计算机支持的合作工作会议上获得了最佳论文奖。

“一个人的生活方式与数据库中记录和登记的有关他们的内容之间存在着深刻的关系,”Singh说,他现在是 Data & Society 的博士后学者,Data & Society 是一个独立的非营利研究组织,专注于数据和自动化。

“当它们对齐时,你会以‘高分辨率’表现出来,这些系统非常适合你,”Singh说。“但是当它们发生故障时,它们会以非常不均匀的方式发生故障。捕捉这种不均匀性需要我们像基础设施一样看待。”

Aadhaar 于 10 多年前推出,是世界上最大的基于生物识别技术的身份识别数据库。Aadhaar 注册的居民超过 12.5 亿,旨在为所有印度居民提供标准化的合法身份,包括以前没有身份证件的人。

注册人存档生物识别(10 个指纹、两张虹膜照片、一张面部照片)和人口统计(姓名、年龄、性别、住址)信息,并获得一个 12 位数的号码,类似于 9 位数的美国社会安全号码。

在实地工作中,Singh在 2015 年、2016 年和 2018 年三度返回他的祖国印度,总共 18 个月,并采访了广泛的利益相关者,包括实施 Aadhaar 的印度唯一身份管理局的成员。

Singh 对实施 Aadhaar 的计划与参与该计划的公民的实地现实之间的脱节(如果有的话)很感兴趣。

“这是参与该项目的部分动力,”他说。“我一直有一种预感,它会深刻地塑造印度公民的性质,尽管这个数字从未被声称是公民身份的指标。它被宣传为一种在政府数据库中唯一识别人的方式。”

Singh和杰克逊在阅读有关该主题的先前文献时提出了术语“低分辨率”和“高分辨率”公民。Aadhaar 的一个问题是,指纹不清晰(分辨率不够高)的人很难在数据库中注册。

“所以,在某种程度上,这让史蒂夫和我能够真正谈论人们如何需要‘高分辨率’才能成为系统的一部分,”Singh说。

Singh说,将“低分辨率公民”归为社会经济规模的低端,将“高分辨率公民”归为另一端,这是可以理解的,而且通常是准确的,但这不是绝对的。

“这不仅仅是关于社会等级,”他说,“它是关于等级的,因为它通过数据表现出来。”

不过,杰克逊说,边缘性往往会堆积起来。“通常情况是,”他说,“如果你在一个系统中被边缘化,那通常会成为在其他系统中变得边缘化的一种方式。”

最后,Singh写道,在国家治理中使用大数据系统是一项社会和道德挑战:“社会,因为将人口组成和解释为数据需要工作、组织和纪律;道德,因为使用数据来代表公民不可避免地会提高公平、问责和包容的实际和规范问题。”

杰克逊称赞Singh的工作,这也构成了他的合作者的博士论文的基础。

杰克逊说:“这是一个非常有力的例子,说明了看似普遍的系统的不同影响,”并指出美国选民身份证法是另一个例子。“即使是善意提供的系统也可能具有普遍性或包容性,同时在结果上有所差异。

“其中一些是摩擦造成的,”他说。“如果你让一些人更难进入,那会让某些人的生活变得更艰难。但对其他人来说,它只是流动。结果是一种差异化的影响,以及对不平等的微妙但重要的贡献。”

本文为作者 何斌 独立观点,并不代表 我是CIO 立场。

发表评论

登录后才能评论