谷歌AI破译古籍再创新高:错误率仅0.56%,准确度堪比人类专家

IT之家 11 月 16 日报道,科技媒体 Golem 昨天(11 月 15 日)发表了一篇博文,报道称谷歌正在通过其 AI Studio 平台测试一种尚未命名的人工智能模型,该模型在破译困难的历史文献方面接近人类专家的水平。 IT House 引用了历史学家 Mark Humphreys 的一篇博客文章,他表示他使用了专门开发的基准数据集来系统地测试模型的性能。他们发现,在处理五份困难的历史手稿时,该模型的整体字符错误率约为 1.7%,其中大多数错误与标点符号和大写相关,而不是单词本身。 Humphries 的评估还指出,如果排除歧义标点符号和大小写错误,AI 模型的字符错误率将骤降至 0.56% 左右。这相当于每 200 个转录字符出现一个错误。从新发现的未知 Gemi 转录而来的奥尔巴尼分类帐页面的惊人准确性该模型的性能可与专业人士抄写历史文献的工作相媲美。测试的文档涵盖了 18 世纪和 19 世纪的各种书写风格,包括字迹难以辨认、拼写错误和语法不一致的复杂样本,进一步凸显了该模型的能力。该模型最引人注目的表现是它超越了简单的文本转录,展现了复杂的推理能力。这是一本18世纪的商人日记,原文中有购买糖的记录,只标有数字“145”,没有计量单位。谷歌的人工智能模型不是直接翻译“145”,而是生成“14磅,5盎司”。研究人员发现,人工智能能够通过重新计算账本中记录的总价并将其与英国货币(英镑、先令和便士)与重量单位之间的关系相结合来得出这一结果。那个时候。虽然初步结果令人鼓舞,但汉弗莱斯也强调了当前评估的局限性。该模型通过 A/B 测试零星出现,因此很难进行大规模系统测试,迄今为止仅对 Chimark 数据集中约 10% 的样本进行了评估。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交网络平台。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注