找出十二生肖的兼容性
认识 Forensia,一款准备揭穿假 WhatsApp 音频文件的软件
事实核查

通过 Inferiorz 礼物/Shutterstock
当需要验证从 WhatsApp 提取的音频文件时,事实核查人员通常会翻白眼。他们知道这是一项耗时的任务,并且缺乏帮助他们对听到的声音做出判断的工具。然而,这种情况刚刚发生了变化。 Forensia 在布宜诺斯艾利斯启动并运行,并准备好使用撒克逊语和罗曼语种语言——但不是免费的。
Forensia 由阿根廷国家科学技术研究委员会 (Conicet) 下属的感官研究实验室 (LIS) 推出,顾名思义,是上周首次用于事实核查的取证软件。
本月初,阿根廷事实核查组织 检查 看到一个音频文件在 WhatsApp 上传播开来,并决定在 LIS 的一份报告上花费 10,000 比索(因为 Chequeado 是一个国家非政府组织)。
该平台的主管 Laura Zommer 对她的团队获得的结果感到惊讶,并决定与国际事实核查网络分享这一经验。
她说:“我们总是会收到许多需要核实的音频文件,虽然我们一直想验证它们,但我们一直没能做到。” “Forensia 不是一个便宜的解决方案,但绝对应该用于验证重要主题以及涉及重要角色时。”
Chequeado 上周手头的案子非常强大。在他们想要验证的音频文件中,据称一位特定的政客指责整个非白人社区投票支持基什内尔主义,因为“黑人*想要烧烤、便宜的葡萄酒、啤酒、大量的啤酒、火锅和可卡因。” Chequeado 需要确认听到的声音是否真的来自国会议员吉列尔莫·黑山——正如在 WhatsApp 和其他社交媒体渠道上传播的那样。
指导 LIS 的研究科学家 Jorge Gurlekian 收到了 WhatsApp 文件,并要求事实核查人员提供其他来自黑山声音的真实音频文件。他将所有这些都插入了 Forensia,几分钟后,他得出结论,那个声音几乎不可能是黑山的。在从 -5 到 +5 的范围内,音频剪辑被评为 -1。
“我们首先将被质疑的文件与带有候选人真实声音的文件进行比较。然后,我们将受质疑的文件与一个巨大的声音数据库进行比较,该数据库来自出生和居住在候选人所在地区的人的声音和声音,”Gurlekian 解释说。 “我们的最终答案绝不是二元的。这是一种可能性,我们强烈建议事实核查人员使用 Forensia 作为他们工作的另一个证据——就像法官使用 DNA 测试一样。”
Gurlekian 几十年来一直在研究语音识别,并长期帮助他的国家的安全部队和司法系统。他现在很高兴看到他的知识和他的工具可以用于打击在线错误信息。
“我的团队由 Miguel Martinez Soler、Pedro Univaso 和我组成,100% 准备好与事实核查人员合作并在该领域进行实验,”他说。 “我们只需要记住一些技术要求是必要的。例如,被质疑的音频必须至少 15 秒长才能被验证,并且必须在语音上很复杂。例如,你只听到一个人说‘是的,是的,是的’的文件不适合 Forensia。”
在软件中运行的完美文件格式是 .wav,但 Gurlekian 知道这在虚假新闻领域是不现实的,并准备处理 WhatsApp 录音。在每个文件中验证了大约 90 个不同的指标,其中大多数与所说的内容无关,这就是该工具可以处理许多成语的原因。
Forensia 可以在计算机上获得许可和安装,但 Gurlekian 建议国际事实检查社区现在迈出一小步,并允许 Gurlekian 运行测试。
要完全理解软件提供的报告,需要进行一些培训。将本地语音数据库输入 Forensia 以从机器获得更精确的报告也很重要——只有 Gurlekian 和他的团队才能做到这一点。
“世界上最发达的国家已经拥有关于公民声音的公共数据库。其中一些甚至被划分为区域,其中一些数据库是公开的。但其他人不是,”Gurlekian 说。
Forensia 还可以指出文件中的版本,并帮助确定何时对句子进行了更改。
那么它的局限性是什么?
“限制可能是老化。男孩和女孩的声音会随着时间而变化。如果我们质疑他们年轻时录制的音频,我们将需要当时真实声音的例子进行比较,这可能很难。”
* 西班牙语中使用的术语是“los negros”。这通常是指非白人、贫穷和移民社区。
Cristina Tardáguila 是国际事实核查网络的副主任。可以通过电子邮件联系到她。