有挑战才有收获!PaddleOCR 算法模型挑战赛火热开启!

原创
01/24 10:23
阅读数 24

在数字化时代,文本和表格识别在生活和工作中扮演着越来越重要的角色。从扫描件、图片中的文字提取,到自动化录入数据、分析报表,这些场景都需要高效准确的文本识别和表格识别技术。作为 PaddleOCR 开源项目背后的维护者,飞桨团队一直致力于提升光学字符识别(Optical character recognition,OCR)技术的精度和效率,满足广大开发者和用户的需求。

PaddleOCR 开源项目地址

https://github.com/PaddlePaddle/PaddleOCR

为了激发广大开发者的创新精神,进一步提升 OCR 模型的精度和性能,赋能更多的实际应用,开放原子开源基金会和百度飞桨共同举办了「PaddleOCR 算法模型挑战赛」。

本次大赛是一项 OCR 领域的高难度技术挑战赛,要求参赛团队基于 PaddleOCR 开源项目,研发更高效准确的新模型,不断突破技术瓶颈。上期比赛情况回顾,请参看:https://pfcc.blog/posts/wuxi-kaifangyuanzi

赛题介绍

飞桨赛道共计发布两大赛题:OCR 端到端识别任务通用表格识别任务,参赛者需要任选一项任务,基于共建方提供的评估数据,给出相应的评估指标。同时,参赛者在提交解决方案时,需要保证推理速度与组织方提供的基线相当。

赛题一:OCR 端到端识别任务

参赛者需要解决通用场景的 OCR 端到端识别问题,构建高效准确的 OCR 模型。要求新模型端到端指标 F-measure 超过 62.24%。

赛题二:通用表格识别任务

参赛者需要解决表格结构复杂、数据分布不均等问题,提出具有创新性且高效推理的表格识别算法。要求在 PubTabNet 评估集上 ACC 超过 76.31%。

时间安排

  • 2024.1.15 - 比赛启动,参赛团队报名;

  • 2024.1.15 - 开放提交,榜单每日更新;

  • 2024.3.31 - 作品提交截止;

  • 2024.4.8 - 初审结束,公布决赛答辩名单;

  • 2024.4.15 - 进行线下评比(拟定)。

奖项设置

奖金池:¥300,000。

赛题一:OCR 端到端识别任务

  • 一等奖:1 支队伍,奖金 15 万元

  • 二等奖:1 支队伍,奖金 4 万元

  • 三等奖:1 支队伍,奖金 1 万元

  • 开源贡献奖:7 支队伍,荣誉证书

赛题二:通用表格识别任务

  • 一等奖:1 支队伍,奖金 7 万元

  • 二等奖:1 支队伍,奖金 2 万元

  • 三等奖:1 支队伍,奖金 1 万元

  • 开源贡献奖:7 支队伍,荣誉证书

更多大赛细节,前往开放原子开源基金会官方大赛页面了解详情。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部