
-
生物通官微
陪你抓住生命科技
跳动的脉搏
AI辅助考古工作流:基于神经网络的考古图录目标检测与数据采集新方法
【字体: 大 中 小 】 时间:2025年06月06日 来源:Journal of Archaeological Science 2.6
编辑推荐:
推荐:本研究针对考古数据整合中图像标准不统一、人工预处理耗时等问题,开发了AI辅助工作流AutArch。通过RetinaNet和Resnet神经网络实现PDF图像中墓葬、骨骼、比例尺等目标的自动检测与分类,结合轮廓提取技术获取形态计量学数据。该技术显著提升了第三千年欧洲墓葬和箭镞分析的效率与标准化程度,为考古大数据的自动化采集提供了创新解决方案。
考古学研究正面临数据爆炸与整合困境。每年新发掘的考古证据数量远超人工分析能力,而早期文献中的线图、照片等"遗产数据"因记录标准不一难以直接比较。传统方法需人工完成图像筛选、缩放、旋转等繁琐预处理,样本量受限严重制约了大数据的应用。尤其对于第三千年欧洲考古而言,不同地区对墓葬尺寸、朝向的测量标准差异显著,导致"绳纹陶文化"(Corded Ware)与"钟杯文化"(Bell Beaker)等关键时期的对比研究存在系统性偏差。
来自德国约翰内斯古腾堡大学等机构的研究团队开发了AI辅助工作流AutArch,通过深度学习技术实现考古图录的自动化数据处理。该系统采用RetinaNet目标检测网络识别PDF文档中的墓葬、骨骼等11类考古要素,结合Resnet-152网络分析方向箭头角度,利用轮廓提取技术获取标准化形态数据。研究测试了391页考古图录的训练集,在捷克Vliněves遗址的墓葬分析中实现147例"绳纹陶文化"与6例"钟杯文化"墓葬的自动比对,相关成果发表于《Journal of Archaeological Science》。
关键技术包括:1) 基于391页标注数据的RetinaNet目标检测系统;2) Resnet-152网络的无监督角度识别;3) OpenCV轮廓提取与椭圆傅里叶分析(EFA);4) 包含8个步骤的半自动化验证工作流。测试样本来自中欧第三千年墓葬和西北欧新石器-青铜时代箭镞的出版图录。
【材料与方法】
研究构建了包含376座墓葬、404具骨骼的标注数据集,涵盖手绘扫描图与数字插图。采用两阶段处理流程:先通过神经网络检测页面元素并建立空间关联,再通过轮廓分析获取尺寸、朝向等定量数据。比例尺识别结合OCR技术与轮廓分析,北向箭头角度通过预训练的Resnet-152网络计算。
【结果】
4.1.1 骨骼朝向分析
自动生成的径向图显示,"绳纹陶文化"墓葬呈东西向主导(平均方位角78°),而"钟杯文化"转为南北向(平均方位角8°),与文献记载的埋葬习俗差异吻合。
4.1.2 墓葬轮廓几何学
椭圆傅里叶分析表明,两类文化的墓穴轮廓在形状上无显著差异(PCA重叠度达92%),支持"单一葬仪传统"假说。109例墓穴的EFA分析仅需传统方法1/10的时间。
4.1.3 箭镞轮廓应用测试
在Nicolas(2016)箭镞数据集上的测试显示,系统可处理不同分辨率、背景的插图和照片,成功复现了西北欧箭镞的时空分布模式。
4.3 工作流效率评估
用户研究表明,AutArch使单墓记录时间从15.6分钟降至4.3分钟,错误率降低68%。每墓平均仅需3次人工校正,较传统矢量软件效率提升显著。
【结论与讨论】
该研究建立了首个面向考古图录的AI辅助分析框架,解决了三个关键问题:(1)通过自动比例尺识别实现了跨文献数据标准化;(2)北向箭头角度计算将朝向记录精度从定性描述提升至定量分析;(3)轮廓提取技术为形态计量学提供了可扩展的解决方案。
技术层面,研究证实RetinaNet在考古线图检测中的适用性(mAP达0.87),但指出当前391页的训练集规模仍小于通用数据集COCO40。未来通过Transformer架构升级和TPU加速可进一步提升性能。
学术价值方面,工作流支持建立基于实证的考古分类体系,例如通过EFA分析质疑了传统类型学对"绳纹陶"与"钟杯"墓葬的过度区分。研究还展示了如何将NLP(自然语言处理)与图像分析结合,为构建多模态考古数据库指明方向。
研究团队已开源AutArch代码,并计划建立协作平台整合全球考古资料。该方法可扩展至陶器、建筑遗迹等分析领域,或将重塑考古记录的数字化标准。伦理方面,作者强调AI工具旨在辅助而非替代人工验证,最终解释权仍归属领域专家。
生物通微信公众号
知名企业招聘