开运(中国) 天下“圆圈识别”大赛冠军团队接收《环球时报》专访:中国AI字迹识别达成技能跃升

【环球时报报谈 记者 李迅典】念念象一下:有东谈主在一张支票上,把“1000欧元”坏心改成了“100000欧元”。多出来的那两个“0”歪七扭八,却可能让金融机构耗费惨重。你能凭这个粗率的圆圈,揪出点窜者吗?这听起来像是刑侦剧里的高难度桥段。但在群众顶尖的东谈主工智能(AI)行家眼中,这是一个细枝末节的“考题”。在近日举行的ICDAR 2026-CircleID(圆圈书写者身份识别)群众竞赛中,中国重庆一家科技公司的算法行家覃勋辉斥地的团队,在群众113支顶尖科研团队中杀出重围,以越过第二名10.6个百分点的完全上风斩获天下第一。而他们击败各路妙手的“火器”,是5905个手绘的圆圈。

“天下上莫得两个完全相通的‘当然圆’”
“好多网友合计神奇,毕竟在普通东谈主眼里,圆圈不即是一条浅薄的闭合弧线吗?”面对《环球时报》记者的发问,重庆亲笔签数字科技有限公司的算法行家覃勋辉革新了一个要道主见:比赛中要求的,可不是用尺规画出的完好正圆,而是东谈主手当然写出来的“圈”。
“受个东谈主肌肉缅念念、神经纵容以致其时脸色的影响,每个东谈主画出的圈齐是唯一无二的‘椭圆变体’。”覃勋辉解释谈,这个圈的歪斜角度、黑白轴比例、起笔与收笔的狭窄抑扬、运笔进程中的速率变化,以致墨迹的浅深散播,齐遮蔽着书写者独到的“生物密码”。“就像指纹同样,天下上莫得两个完全相通的‘当然圆’。”
而这场群众挑战赛的中枢,恰是要破解“凭单一粗率字迹(如支票上的点窜圆圈)识别书写者”的现实珍视——这亦然著述来源支票点窜案例的核肉痛点。本次CircleID竞赛,由群众文档分析与识别限制泰斗机构海外文档分析与识别大会(ICDAR)主持,并在顶级数据科学竞赛平台Kaggle上进行。任务配置极具挑战:参赛者仅凭这些手绘圆圈的扫描图像,不仅要精确识别出50多位特定书写者的身份,还必须判断测试中的圆圈是否来自这50东谈主除外——即具备“拒识未知东谈主员”的本领。
更“夸张”的是,每位书写者使用了8种不同类型的笔。圆珠笔顺滑、马克笔晕染……跨笔书写的干涉,让本就稀缺的识别特征变得愈加扑朔迷离。
“当初团队策划是否参赛时,争议很大,因为难度真实太高。”覃勋辉称,最终决定参赛,一是为了考据技能领域——这家重庆科技公司自2022年起,就已在群众有名的SVC-onGoing字迹辨认大赛中相接霸榜,该赛事与本次CircleID同属字迹识别限制顶尖赛事,仅仅更侧重惯例字迹(姓名、长文本)识别,这次念念试试在极限要求下的技能实力;二是为了与海外对标,“Kaggle平台汇注了群众顶尖团队,咱们念念望望中国团队在这个细分赛谈上,到底能达到什么水平。”
“比的不是‘认圆’,是极致的特征索要”
“普通东谈主看圆圈,只看圆不圆、收口朝哪边;但咱们的AI看圆圈,看的是遮蔽在线条里的书写风气。”覃勋辉强调,这场比赛的中枢,从来不是浅薄的图像分类,而是极致的特征索要与建摹本领,这也恰是其最大的难点场所。
他进一步拆解了比赛的三大中枢难点。其一,动态特征缺失。与电子化字迹识别不同,这次比赛的样本是纸质扫描件,书写速率、压力、加快度等要道动态特征全部隐匿,相配于让AI“闭着眼睛”判断。其二,静态特征少量。不同于传统字迹有布局、搭配、写法等字迹特征,一个圆圈莫得高下文、莫得笔顺,可分析的信息被压缩额外致,只可依赖其独到的狭窄口头特征(如歪斜角度、墨迹浅深)进行识别。其三,跨笔干涉严重。8种不同笔具带来的线条相反,开运(中国)足以让团结个东谈主书写的圆圈呈现出判然不同的外不雅,进一步加多了识别难度。
“这相配于让算法在清寒动态步履特征、静态特征信息也近乎灭失的极限要求下,仅凭一个二维圆圈的口头完成身份识别。”覃勋辉坦言,比赛初期,团队一度堕入“鏖战”,主流视觉模子发达平平,收货弥远在三、四名徜徉,“直到比赛终末一周,咱们仍未登顶。”
逆境之下,团队莫得盲目调参,而是选定追想字迹生成的物理本源——静态轨迹亦蕴含动态时序。依托团队在字迹序列建模限制深厚的技能积贮,翻新性地建议了深度椭圆编码交融模子,旨在从静态几何口头中重构隐含的能源学特征。“这个模子的中枢过东谈主之处,即是把静态的圆圈‘动态化’。”覃勋辉称,团队将圆圈轨迹拆解为包含椭圆体式、角度、速率等模拟数字字迹的特征序列,再与视觉特征深度交融,相配于给静态的圆圈“归附”出了书写时的动态进程。这一翻新计谋在比赛终末3天爆发了惊东谈主威力,团队收货一起飙升,最终以超第二名10.6个百分点的完全上风逆转夺冠。
这场收效,不仅是一个团队的粉碎,更符号着中国在AI字迹识别限制的技能跃升。覃勋辉默示,当年字迹识别的中枢技能道路主要由西洋学术团队主导,而这次夺冠,说明了中国团队在细粒度字迹特征索要、动态序列建模等要道底层技能上,一经具备了与海外顶尖团队同台竞技以致提供更优解的本领。
“这不是炫技,是刚需”
识别一个圆圈,听起来很酷,但它到底是实验室里的“屠龙之伎”,如故真能转变现实?
“这毫不是炫技。”覃勋辉对《环球时报》记者默示,这场比赛的主持方选定了最难、信息最少的字迹样本。“咱们在画圈上齐能识别出版写东谈主的身份,那么在正常的签名比对、电子化签名字迹识别上,精度只会更高。”
据覃勋辉先容,该团队自主研发的数字字迹AI识别技能,经公安部第一筹画所的泰斗机构检测,中枢精度已达到99.9%。
这项技能的落地场景远比念念象中浩繁。据先容,在金融反讹诈限制,凭借对“当然圆”的精确识别本领,这项技能能捕捉书写者的狭窄字迹特征——即便仅仅支票上被点窜的一个“0”(推行上是粗率的小圆圈),也能通过其运笔、墨迹特征,锁定点窜者身份,进而专揽到更通俗的金融告示比对场景。
除了识别被点窜的支票,它还能在供应链金融、信贷审批武艺,比对契约、发票、仓单等文献的字迹。一朝出现款额、日历被点窜或署名伪造,系统会自动标红预警。
在而已身份认证场景,现时主流的“东谈主脸识别”正面对AI换脸、深度伪造的繁多风险。“将AI字迹识别交融进来,相配于多加了一把安全锁。”覃勋辉说。
而在公检法司限制,这项技能一经深度落地,相沿机灵驾考、而已提讯、而已打算、移动国法、在线统一等典型场景。当今,该技能已在政务、公检法司、金融、医疗等行业多半专揽。仅重庆一地,就相沿了60余个委办局、180多个系统场景的专揽,年调用量破亿次。
“咱们但愿能让字迹成为每个东谈主的数字身份。”覃勋辉默示,凭借团队在细粒度特征索要、动态步履建模上的上风开运(中国),改日不错为关连本领提供技能相沿。
乐动中国手机app官网