|
李祖超老师团队在EvaHan2026古籍多模态OCR国际评测中获一等奖 . }: @/ z/ G( @7 |% m8 q& M0 _
5月11日,EvaHan2026 古籍多模态 OCR 国际评测在西班牙马略卡岛成功举办。本次评测在语言资源大会LREC 2026子会议“古代和历史语言技术研讨会LT4HALA 2026”上举行,聚焦古代汉语OCR与版面分析任务,旨在系统评估大模型在真实古籍图像上的端到端识别与版面理解能力。 ; _) e7 E6 j6 x& v' [ F

在本次国际评测中,学院李祖超副教授带领团队 WHU-SAI Team 凭借多阶段优化策略 SFT+DPO+GRPO,在版面分析任务中获得一等奖。该成绩体现了学院科研团队在多模态人工智能、古籍文档智能理解和复杂版面分析等方向的研究积累,也展现了学院面向国际学术前沿、服务中华优秀传统文化保护传承的创新能力。 : c& V% s4 k$ ?$ Y! ^
古籍是中华文明的重要载体,也是人类文明的珍贵组成部分。随着数字人文和文化遗产数字化研究的深入推进,如何将海量古籍图像转化为可检索、可计算、可理解的数字资源,已成为古籍保护、整理、研究与传播中的关键问题。与现代印刷文档相比,古籍文献在文字形态、版式结构和图文关系等方面更为复杂,常见的异体字、罕见字、双行夹注、图文混排以及手写字迹等因素,都对 OCR 识别和版面理解提出了更高要求。 ' `9 O! H2 E" z, |# ?/ I
EvaHan系列国际技术评测长期关注古代汉语智能处理任务,已先后围绕分词词性标注、机器翻译、断句标点、命名实体识别等方向开展评测。2026年,EvaHan 将研究重点转向更具挑战性的古籍多模态 OCR 任务,力求建立高质量数据集和统一评测基准,推动古籍视觉处理研究向系统化、规范化方向发展。 
( t+ F8 \* Y( S. H6 u$ v" A- j* J
本届评测历时5个月,共有来自中国、法国等海内外高校与科研机构的41支队伍报名,13支队伍完成比赛,四十多位海内外学者线上线下参加评测研讨会。评测报告显示,在文字识别任务中,版刻汉字识别效果相对较好,而手写汉字因连笔和俗字等因素识别难度更高;在版面分析任务中,双行夹注与正文区域容易混淆,版面分析精度明显低于文字识别,是当前古籍 OCR 技术发展中的突出瓶颈;同时,异体字与长尾罕见字仍是影响识别准确率的重要因素。
; S% k. u* Y) s/ p: g
面对真实古籍图像中的复杂场景,学院李祖超老师团队以领域问题为牵引,围绕版面分析任务开展技术攻关。团队采用多阶段优化策略,将监督微调、偏好优化与强化学*优化等方法相结合,提升模型对古籍版面结构的理解能力和复杂布局的分析能力,最终在国际评测中取得优异成绩。 |