当前位置:首页 > 家装 > 装修报价 > 文章正文

13 个字母价值 4 万美元?21 岁大年夜学生用 AI 破译千年古卷!

编辑:[db:作者] 时间:2024-08-24 23:30:49

提问:什么历史性造诣?答:成功破译了 2000 年前被掩埋、已碳化且无法打开的赫库兰尼姆古卷中的一个单词。

提问:卷轴都没打开,他是怎么破译的?答:利用 AI 技能。

13 个字母价值 4 万美元?21 岁大年夜学生用 AI 破译千年古卷!

这位获奖者名为 Luke Farritor,而这个代价 4 万美元的奖项是维苏威火山寻衅赛的 First Letters Prize(首字母奖),其获奖哀求是参赛者在卷轴中 4 平方厘米的区域内找到至少 10 个字母。

利用高能 X 射线和 AI 技能,对古代卷轴进行成像

公元 79 年,维苏威火山爆发,摧毁了庞贝城和赫库兰尼姆城,连带着存于庞贝附近一座私人图书馆中的古代卷轴也被掩埋。
近 2000 年来,这座唯一幸存的图书馆一贯被埋在地下 20 米深的火山泥中,直到 1700 年代才被挖掘出来。
可由于在火山灰和气体的灼热浸染下,这些卷轴早已碳化、非常薄弱,轻微处理不当就会立即化为灰烬。

如何在不打开卷轴的条件下,阅读个中的内容?数百年来,这个问题一贯没有答案。
基于此,2023 年 3 月,维苏威火山寻衅赛正式发起——而它的设立,最早源自于 2019 年肯塔基大学 EduceLab 的 Brent Seales 教授在粒子加速器中,成功对赫库兰尼姆古卷进行了成像。

多年来,专家们考试测验通过各种方法试图展开古代卷轴,但有些在展开过程中就毁坏了,有些则是展开后笔墨暴露在空气中会导致墨水褪色。
Brent Seales 教授带领的团队曾通过高能 X 射线识别出了恩盖迪(En-Gedi)卷轴中的笔墨。

但恩盖迪卷轴的墨水是金属基的,因此在 X 射线数据中会显示出来,而赫库兰尼姆古卷上的墨水可能是碳基的,与纸张身分有重合,因此在 X 射线扫描中无法明显成像。
也便是 Brent Seales 所说的:用肉眼无法从略微不同的 X 射线技能捕捉到的扫描结果中,解读出赫库兰尼姆古卷中的字母。

基于这个现状,Brent Seales 研究小组提出了一种新方法:利用高能 X 射线和 AI 技能中的机器学习模型。
详细来说,便是先扫描并拍摄带有可见墨水的分离卷轴碎片照片,然后将这些照片喂给机器学习模型,使其找出并学习 X 射线扫描中墨水区域和空缺区域之间的细微差别。
一旦经由这样的碎片化演习,该模型就有望与完全卷轴的数据结合利用,从而识别个中的笔墨内容。

通过这种方法,2019 年 Brent Seales 团队在粒子加速器中对赫库兰尼姆卷轴进行成像,成功天生了分辨率高达 4 微米的 3D CT 扫描。

这一成功引起了科技企业家 Nat Friedman 和 Daniel Gross 的把稳,并为了加快破译古代卷轴,发起了维苏威火山寻衅赛:总奖池高达 70 万美元,还为开源工具和技能的开拓颁发了几个较小的奖项。

演习 AI 模型识别“裂纹图案”

自今年 3 月维苏威火山寻衅赛正式发起,吸引了诸多参赛者,个中 Casey Handmer 是前 JPL 公司的创始人,他在八月初写了一篇博文,提到他创造了一种看起来像是墨水痕迹的 “裂纹图案”。

(左图:可见有裂纹的墨水纹理。
右图:显示墨水位置的标注。
它可能是“pi”,也可能是大写“eta”的底部)

通过连续数小时盯着分段 CT 扫描图像,Casey Handmer 创造了这一图案——这绝对是一个重大而令人惊异的创造,由于此前在卷轴中并没有看到过这种图案。

基于 Casey Handmer 的创造,不少参赛者也开始探求裂纹图案,这次得到 4 万美元奖金的 Luke Farritor 便是个中一员,他是一名在读大学生,也曾是一名 SpaceX 暑期演习生。

Luke Farritor 在 Discord 上看到有人在谈论这一话题,便开始利用晚上和深夜的韶光对裂纹图案进行机器学习模型演习。
他找到了几十个墨迹笔画和一些完全的字母,将其进行标记并用作演习数据。
每创造一个新的裂纹,模型就会得到改进,从而找出卷轴中更多的裂纹图案——在这种循环中,模型不断进化。

没过多久,Luke Farritor 演习下的 AI 模型就找到了他肉眼看不见的裂纹图案,并开始形成了一些字母和实际单词的蛛丝马迹。
于是 Luke Farritor 向维苏威火山寻衅赛的 First Letters Prize(首字母奖)提交了第一份参赛作品(哀求在 4 平方厘米的区域内找到至少 10 个字母):

创造 13 个字母,得到 4 万美元奖金

在这幅图中,隐约可以看到 (porphyras)一词的轮廓。
Brent Seales 教授看到这张照片时也非常惊异:只管字母很模糊,但他们一眼就能读出 \公众porphyras \"大众这个单词。

经由全面的技能审查后,寻衅赛官方将 Luke Farritor 提交照片的更新版本发给了专业技能小组,他们在个中标注了 13 个可见字母,只管可信度各不相同(绿色:可信度超过 80%;黄色:可信度在 50-80%;赤色:可信度低于 50%):

个中,Porphyras 这个单词虽然在古代文献中比较罕见,但也经得起考虑,其意思便是“紫色的”(注:这种古笔墨中的字母与当代笔墨看起来有点不同,且该期间的文本不该用空格,因此很难确定单词的边界)。

对此,一位干系专家补充道:“,可能是 (名词,紫色染料或紫色布)或 ᾶ(形容词,紫色)。
由于缺少高下文,无法打消 [ 或 ᾶ [ 的可能性。

终极,Luke Farritor 提交的这张照片得到维苏威火山寻衅赛的官方认可,得到了 4 万美元的 First Letters Prize(首字母奖),而他本人在得知这个好的第一韶光也十分愉快:

此后不久,另一位参赛者 Youssef Nader 基于 Luke Farritor 的机器学习方法进行了改进——采取领域转移技能,使这些模型适用于卷轴:在卷轴数据上进行无监督预演习,然后在片段标签上进行微调。
通过这种办法,Youssef Nader 在同一区域创造了同样的单词,其结果更为清晰可见,从而赢得了该奖项的第二名,得到了 1 万美元的奖金。

值得一提的是,几天前 Youssef Nader 的 AI 模型识别出了令人震荡的清晰度和大小的新图像:虽然并非所有字母都清晰易读,但可以看到有四列半的文本内容。

“我们的专家团队正在努力进一步调查,很快会有这方面的更新。
”对付这个创造,维苏威火山寻衅赛官方的乐不雅观感情空前飞腾:这些进展表明,斩获 70 万美元的大奖“指日可待”!

参考链接:

https://scrollprize.org/firstletters

https://caseyhandmer.wordpress.com/2023/08/05/reading-ancient-scrolls/

https://www.theguardian.com/science/2019/oct/03/ancient-scrolls-charred-by-vesuvius-could-be-read-once-again

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/lz/zxbj/27316.html

XML地图 | 自定链接

Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码

声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com