• 我的订阅
  • 科技

亮相2024中国图象图形大会,合合信息文档解析技术获行业关注

类别:科技 发布时间:2024-05-31 18:22:00 来源:爱云资讯

近日,2024中国图象图形大会在古都西安盛大开幕。本届大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,通过二十多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。

大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委会与上海合合信息科技股份有限公司(简称“合合信息”)联合主办了《大模型技术及其前沿应用》论坛,来自华南理工大学、上海交通大学、清华大学、复旦大学、上海人工智能实验室、合合信息等高校、研究机构及企业的专家代表就大模型技术在图像领域的发展、应用进行了深入研讨。

亮相2024中国图象图形大会,合合信息文档解析技术获行业关注

图说:行业关注者聆听《大模型技术及其前沿应用》论坛分享

大模型一路“高歌猛进”的背后,隐藏着一场关于模型训练语料的“能源危机”。根据人工智能研究人员小组Epoch研究估计,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。现阶段,大量的高质量语料数据存在于书籍、论文、研报、企业文档等文档之中,复杂的版面结构制约了大模型的训练语料处理及大模型文档问答的应用能力。文档解析技术的进步,让机器能够识别文档中的多种元素,更好地处理文本、表格、图像等多类型数据,还原文档阅读顺序,加速大模型训练与应用。论坛上,合合信息智能创新事业部研发总监常扬分享了合合信息智能文档处理技术在文档解析领域的工作,给与会者带来了新的技术视角。

“文档解析的难点在于如何准确识别文档中的各个元素,并理解其之间的逻辑关系,需要关注'物理版面分析'和'逻辑版面分析。'”据常扬介绍,物理版面分析侧重于视觉特征、文档布局,主要任务是把相关性高的文字聚合到一个区域,比如一个段落,一个表格等等,并选用目标检测任务进行建模,使用基于回归的单阶段检测模型进行拟合,从而获得文档中各种各样的布局方式;逻辑版面分析侧重于对语义特征的分析,主要任务是把不同的文字块根据语义建模,例如通过语义的层次关系,形成一个目录树结构。

文档解析技术中文档元素检测、文字表格识别、文档版面分析、阅读顺序还原等任务涉及对版面元素和版面整体布局的判断,是文档处理领域典型的技术难题。通过十几年技术积淀,合合信息打通了电子档解析、扫描档图像处理、文字识别、表格识别、版面分析、版面还原和排版布局等文档智能化处理的全流程,面对电子文档及扫描件,能够灵活地识别文字、表格、无线表、跨页表格、页眉、页脚、公式、图像、流程图等版面元素,准确地还原文档阅读顺序,为大模型领域提供了精准的训练语料与文档问答应用体验。

亮相2024中国图象图形大会,合合信息文档解析技术获行业关注

图说:高校研究者、学生排队体验智能文档处理技术

“我们研究过程中发现,真实世界的文档有着极为丰富的布局类型,没法单纯地用单栏,双栏、三栏等类别去定义。”常扬表示,近年来的开放词汇目标检测(OVD),视觉语义对齐(Alignment)等工作,以及生成式模型等前沿进展,将给版面分析带来新的研究思路,合合信息技术团队也将持续在智能文档处理领域深耕,让新技术在行业中更快速地产生价值。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-31 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...中国新闻网中新网北京6月2日电 (记者 孙自法)记者从中国图象图形学学会获悉,2024中国图象图形大会(CCIG2024)近日在西安举行
2024-06-02 13:24:00
聚焦图像图形前沿技术和创新发展  ICIG 2023顺利举办
...国新闻网中新网北京9月28日电 (记者 孙自法)记者从中国图象图形学学会(CSIG)获悉,由其主办的第十二届国际图象图形学学术会议(ICIG 2023)近日在南京举行
2023-09-28 14:39:00
...的可信AI”的世界人工智能大会专项论坛上,演讲嘉宾、合合信息智能创新事业部总经理唐琪分享了合合信息AI图像安全技术方案。据悉,该方案可精准定位截图篡改痕迹,对生成式图片进行智
2023-07-08 07:54:00
王耀南院士:推动机器视觉产学融合 助力数字中国建设
...闻网中新网北京10月24日电 (记者 孙自法)记者24日从中国图象图形学学会(CSIG)获悉,该学会参与承办的“科创中国”机器视觉产学融合会议近日在湖南长沙举行。中国工程院院
2023-10-24 19:54:00
...识别专委会常务委员、上海市图像图形学学会(SIGA)理事、合合信息图像算法研发总监郭丰俊给出了积极的回答。眨眼、转头、站立可让假视频露馅对一些粗制滥造或技术不太成熟的AI视频
2024-12-24 11:23:00
合合信息:探索数字科技创新应用 赋能文化遗产保护传承
...籍的过程中需攻克各个技术难点。为助力古籍修复,上海合合信息科技股份有限公司(简称“合合信息”)以“AI保护传统文化”为发力点,在图像文字修复领域进行了新的探索,利用AI技术赋
2024-08-30 06:13:00
合合信息(688615)是行业内少有的在C端产品与B端服务同时拥有完善布局矩阵的企业,已经成为全球领先的AI和数据公司,核心业务为智能文字识别和商业大数据业务,均面向个人(C端)
2024-12-13 23:10:00
...大学沈定刚教授等多位权威专家组成专刊编委会在《中国图象图形学报》筹划开设“精准诊断”专刊,主要报道人工智能在精准诊断中应用的最新成果;与西北工业大学张艳宁教授共同主持,在中国
2023-02-13 06:35:00
合合信息:智能文档处理技术助力大学生探索AI创新边界
...励越来越多的青年学子们用创新技术解决现实社会问题。合合信息作为人工智能科技企业的代表,为参赛队伍提供赛题指导与技术支持,与高校学子共同探索技术应用场景广阔蓝海。 图说:中国大
2024-08-27 10:45:00
更多关于科技的资讯: