切换到宽版
  • 12阅读
  • 2回复

[智能应用]在AI笔迹识别赛道上创新突围 [复制链接]

上一主题 下一主题
在线huozm32831

UID: 329002

精华: 1097
职务: 超级斑竹
级别: 玉清道君
 

发帖
122278
金币
9819
道行
19524
原创
29860
奖券
18719
斑龄
209
道券
10977
获奖
0
座驾
 设备
EOS—7D
 摄影级
专家级认证
在线时间: 27311(小时)
注册时间: 2007-11-29
最后登录: 2026-06-22
只看楼主 倒序阅读 楼主  发表于: 昨天 20:28
只看一个手绘圆圈,能认出是谁写的吗?今年4月,在ICDAR 2026—CircleID圆圈书写者身份识别全球竞赛中,我们面对的正是这样一道考题:5905个圆圈、8种笔具、50多位书写者,还要识别样本库之外的未知人员。最终,我们团队从全球113支队伍中脱颖而出,以超过第二名11个百分点的巨大优势夺得第一。

  我选择笔迹识别这个小众研究方向,很大程度上源于对书法的热爱,这使我更深入地思考不同书写者的书写特点。笔迹不仅是线条形状,更记录着书写者长期书写形成的肌肉记忆。每个人独特的运笔习惯,正是反映个人身份的重要行为生物特征。

  随着数字化转型加速推进,越来越多业务从纸面走向线上。如何确认屏幕另一端的签署人就是本人,如何证明签署行为出于真实意愿,如何让电子证据经得起检验,是数字社会必须回答的问题。让笔迹成为可识别、可验证、可追溯的身份印记,正是我们攻关的方向。

  圆圈识别的价值,在于它将笔迹识别的难度推到极限。圆圈没有复杂的文字结构和上下文,比赛提供的又是纸质扫描图像,书写速度、压力、加速度等动态信息全部缺失。不同笔具造成的线条粗细、晕染、摩擦等差异,也会干扰算法判断。算法必须在极少的信息中寻找稳定的个体特征。

  比赛初期,我们采用主流视觉模型,将圆圈当作图像分类来处理,成绩长期徘徊在第三、第四名。看着榜单上其他队伍的成绩不断提高,参赛队伍又比往年增多,团队迫切需要创新方案来扭转不利局面。那段时间,我不断改进现有视觉方案,投入大量时间编写代码,但提升效果十分有限。我意识到,必须做出更大胆的尝试。圆圈留在纸上是静态图像,而生成它的过程却是连续动作。如果能将静态圆圈重新转化为动态笔迹序列,结合我们更擅长的笔迹序列建模,或许能取得更优的效果。然而,这又引出了新的难题,由于存在大量笔迹断裂、墨迹不清晰等情况,还原圆圈从起笔到收笔的完整动态过程十分困难。

  一个巧妙的想法帮助我们跳出思维定式:为什么非要追求严格的笔序复原?按照特定规律形成可对齐的笔迹序列,是否更可行?于是,我们将圆圈按0度到360度统一展开,像把一条闭合曲线摊平来观察,提取椭圆形态、角度变化、线条起伏等模拟时序特征,再与视觉特征深度融合——回到我们熟悉的笔迹序列建模任务上。凭借长期积累的数字笔迹技术,方案很快实现,模型结果一跃成为新的第一名。技术路线得到验证,那一刻,团队上下倍感振奋。

  技术只有走进应用,才能真正产生价值。近年来,我们团队参与了国家重点研发计划相关项目以及《手写电子签名笔迹鉴定技术规范》的编制工作,在政务服务、执法办案、金融风控、医院诊疗等场景中不断打磨能力。在线上签署、远程提讯等业务中,系统通过记录笔画、笔序、笔压、笔速等动态笔迹特征,服务于可信签署、身份认证、意愿确认和电子存证。

  接下来,我们将继续提高识别精度,推动建设中国人自己的笔迹数据库。对我来说,最理想的未来,是每一次线上签署、确认和授权,都能留下可信、可验、可追溯的身份印记。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
  




    
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
189680
金币
701329
道行
20100
原创
769
奖券
545
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 24136(小时)
注册时间: 2012-06-21
最后登录: 2026-06-22
只看该作者 沙发  发表于: 昨天 21:19
在AI笔迹识别赛道上,创新突围需从技术突破、数据壁垒、场景深耕、生态构建四个维度发力,结合行业最新实践,具体路径如下:

一、技术层面:突破“极限场景”与“黑盒难题”
从静态到动态的“特征重构”创新
传统笔迹识别依赖长文本、笔顺、压力等动态信息,但在“仅凭一个圆圈识别书写者”的极限场景下(如ICDAR2026 CircleID全球竞赛),需通过动态化思维破解信息匮乏难题。重庆亲笔签团队将静态圆圈拆解为“椭圆形状、角度变化、线条起伏”等模拟时序特征,与视觉特征多模态融合,在缺失书写速度、压力数据的情况下,实现99.9%的核心识别精度,最终以超第二名10.6个百分点的优势夺冠

启示:未来需聚焦“低信息量场景”(如潦草涂鸦、单字签名、跨笔书写),通过算法重构隐含的动态行为特征,构建“抗干扰、强鲁棒”的识别模型。

“专家经验+AI”的可解释性突破
传统AI笔迹识别存在“黑盒”问题,难以满足司法、金融等场景的“可采信”要求。亲笔签团队将传统笔迹鉴定专家的经验(如“运笔呆板”“结构松散”)转化为可计算的数学模型,解决了AI与专家经验的融合难题,其技术已通过公安部第一研究所检测,并参与司法部《手写电子签名笔迹鉴定技术规范》标准编写

启示:需推动“AI+领域专家”协同研发,将行业隐性知识显性化,打造“可解释、可追溯、可司法采信”的笔迹识别系统。

二、数据层面:构建“跨模态、全场景”的专属数据库
建立“跨笔具、跨载体”的大规模数据集
亲笔签已建成全球最大的跨模态签名数据集,覆盖不同笔具(圆珠笔、钢笔、马克笔等)、不同载体(纸质、电子屏)、不同书写场景(签名、涂鸦、日常书写)的样本,支撑算法在复杂环境下的泛化能力

启示:数据是笔迹识别的核心壁垒,需通过“政企校”合作(如联合公安、司法、教育机构),采集真实场景下的笔迹数据,构建“全维度、高覆盖”的专属数据库。

聚焦“长尾场景”的数据补全
现有数据集多集中于“规范签名”,但对“潦草笔迹”“儿童笔迹”“老年笔迹”“疾病导致的笔迹变异”等长尾场景覆盖不足。未来需针对性采集这类数据,提升算法在特殊场景下的识别精度(如司法鉴定中“精神障碍患者笔迹鉴定”)。

三、场景层面:从“单一验证”到“全链路信任”
司法领域:打造“证据链闭环”
在远程提讯、在线调解、电子存证等场景中,AI笔迹识别可与区块链、时间戳技术结合,实现“签署-存储-调取”的全链路溯源,确保电子证据的法律效力。亲笔签已落地重庆、四川等多地“远程提讯平台”,实现嫌疑人电子签名捺印的实时核验

延伸:可拓展至“遗嘱公证”“离婚协议签署”等民生场景,解决“远程签署意愿真实性”的痛点。

金融领域:构建“反欺诈防火墙”
在支票、合同、发票等金融文书中,AI笔迹识别可精准识别“金额篡改”“签名伪造”风险。例如,通过捕捉支票上“被篡改的0(潦草圆圈)”的运笔特征,锁定篡改者身份;在信贷审批中,比对申请人提交的合同、仓单笔迹,防范虚假材料风险

延伸:可嵌入供应链金融、跨境支付等场景,成为“身份信任”的底层基础设施。

政务与民生领域:推动“无纸化”升级
在智慧婚登、无纸化病案管理、社保办理等场景中,AI笔迹识别可替代传统“现场核验”环节,实现“远程签署、实时认证”,提升政务服务效率。例如,亲笔签技术已应用于“智慧婚登”,支持新人远程签署结婚登记申请


四、生态层面:构建“产学研用”协同的创新体系
政策与资本的双向赋能
重庆通过“精准帮扶政策+科研院校合作+笔迹大数据研究院”的模式,助力亲笔签从实验室走向产业化
。未来需推动地方政府将AI笔迹识别纳入“数字政府”“数字经济”规划,通过专项资金、场景开放等方式,支持企业技术攻关。

国际标准与话语权争夺
亲笔签在ICDAR2026 CircleID竞赛中夺冠,证明中国团队在笔迹识别领域的全球竞争力。未来需积极参与国际标准制定(如ISO笔迹识别标准),推动中国技术方案成为全球行业标杆,抢占赛道话语权。

总结:AI笔迹识别的“创新突围公式”
技术突破(动态特征重构+可解释AI)+ 数据壁垒(跨模态大数据库+长尾场景补全)+ 场景深耕(司法/金融/政务全链路落地)+ 生态构建(政策/资本/标准协同) = 赛道核心竞争力
如何不发帖就快速得到金币道行
 
我有我可以
在线jjybzxw

UID: 551814


发帖
259273
金币
1003624
道行
2006
原创
2477
奖券
3735
斑龄
47
道券
1645
获奖
0
座驾
设备
摄影级
在线时间: 53519(小时)
注册时间: 2008-10-01
最后登录: 2026-06-23
只看该作者 板凳  发表于: 昨天 22:59
笔迹识别:从圆圈挑战到数字社会的身份守护
圆圈竞赛:脱颖而出的荣耀时刻
在今年4月举办的ICDAR 2026—CircleID圆圈书写者身份识别全球竞赛中,一道看似简单的考题——仅通过一个手绘圆圈来识别书写者身份,却充满了巨大挑战。竞赛提供了5905个圆圈样本,这些圆圈由8种不同笔具书写,出自50多位书写者之手,并且还需要识别样本库之外的未知人员。在如此复杂的条件下,我们团队从全球113支队伍中脱颖而出,以超过第二名11个百分点的巨大优势夺得第一,这一成绩的取得实属不易。
热爱驱动:小众研究方向的探索初心
我选择笔迹识别这个小众研究方向,源于对书法的热爱。这份热爱促使我深入思考不同书写者的书写特点。笔迹并非仅仅是线条的形状,它更记录着书写者长期书写所形成的肌肉记忆。每个人独特的运笔习惯,如起笔、行笔、收笔的方式,运笔的速度、力度和节奏等,都是反映个人身份的重要行为生物特征。这些特征就像每个人的指纹一样独一无二,为笔迹识别提供了理论基础。
数字转型:笔迹识别的时代使命
随着数字化转型的加速推进,越来越多的业务从纸面走向线上。在这个过程中,数字社会面临着一些亟待解决的问题:如何确认屏幕另一端的签署人就是本人?如何证明签署行为是出于真实意愿?如何让电子证据经得起检验?笔迹识别为这些问题提供了解决方案。让笔迹成为可识别、可验证、可追溯的身份印记,成为我们团队攻关的重要方向。通过记录和分析笔迹特征,我们可以在数字世界中为每个人建立一个独特的身份标识,确保线上交易和签署的安全性和可靠性。
圆圈挑战:极限难度下的技术突破
圆圈识别具有极高的难度,它将笔迹识别的挑战推到了极限。圆圈没有复杂的文字结构和上下文,比赛提供的又是纸质扫描图像,这使得书写速度、压力、加速度等动态信息全部缺失。不同笔具造成的线条粗细、晕染、摩擦等差异,也会干扰算法的判断。算法必须在极少的信息中寻找稳定的个体特征,这对我们的技术提出了巨大的考验。

在比赛初期,我们采用主流视觉模型,将圆圈当作图像分类来处理,但成绩长期徘徊在第三、第四名。看着其他队伍的成绩不断提高,参赛队伍数量也比往年增多,团队迫切需要创新方案来扭转不利局面。我不断改进现有视觉方案,投入大量时间编写代码,但提升效果十分有限。这让我意识到,必须做出更大胆的尝试。

圆圈留在纸上是静态图像,而生成它的过程却是连续动作。如果能将静态圆圈重新转化为动态笔迹序列,结合我们更擅长的笔迹序列建模,或许能取得更优的效果。然而,由于存在大量笔迹断裂、墨迹不清晰等情况,还原圆圈从起笔到收笔的完整动态过程十分困难。

一个巧妙的想法帮助我们跳出了思维定式:我们不再追求严格的笔序复原,而是按照特定规律形成可对齐的笔迹序列。我们将圆圈按0度到360度统一展开,像把一条闭合曲线摊平来观察,提取椭圆形态、角度变化、线条起伏等模拟时序特征,再与视觉特征深度融合,回到了我们熟悉的笔迹序列建模任务上。凭借长期积累的数字笔迹技术,方案很快实现,模型结果一跃成为新的第一名。技术路线得到验证的那一刻,团队上下倍感振奋。
应用落地:数字场景中的价值体现
技术只有走进应用,才能真正产生价值。近年来,我们团队积极参与国家重点研发计划相关项目以及《手写电子签名笔迹鉴定技术规范》的编制工作,在政务服务、执法办案、金融风控、医院诊疗等多个场景中不断打磨能力。

在线上签署、远程提讯等业务中,系统通过记录笔画、笔序、笔压、笔速等动态笔迹特征,服务于可信签署、身份认证、意愿确认和电子存证。例如,在金融风控场景中,通过笔迹识别可以验证客户的签署行为是否真实,防止欺诈行为的发生;在政务服务场景中,可以确保线上办理业务的申请人是本人,提高政务服务的效率和安全性。
未来展望:建设中国人的笔迹数据库
接下来,我们将继续提高识别精度,推动建设中国人自己的笔迹数据库。每个人的笔迹特征都受到文化、教育、生活习惯等多种因素的影响,建设具有中国特色的笔迹数据库可以更好地适应国内的需求,提高识别的准确性和可靠性。

对我来说,最理想的未来是每一次线上签署、确认和授权,都能留下可信、可验、可追溯的身份印记。这将为数字社会的发展提供有力的保障,让人们在进行线上交易和签署时更加安心、放心。笔迹识别技术将在数字时代发挥越来越重要的作用,成为守护我们身份安全的重要防线。

如何不发帖就快速得到金币道行
 
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个