• 我的订阅
  • 科技

讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型

类别:科技 发布时间:2024-04-29 21:00:00 来源:爱云资讯

4月26日,科大讯飞发布讯飞星火V3.5更新版本,首发星火图文识别大模型,赋予大模型感知现实世界的能力。这标志着国产大模型在支持图文输入领域的一次重要突破。

事实上,尽管先进的大模型在语言交互方面展现出了卓越的能力,但它们在图文识别领域的表现却不尽如人意。去年10月,华南理工大学针对此前发布的GPT-4Vision做了一篇全面评测,结论是GPT-4Vsion识别文字的能力比OCR专用模型低了几十个点,尤其在手写中文文本识别中表现出明显的幻觉问题。

国内多数面向C端的大模型应用产品较少具备图文识别能力。一家头部国产大模型应用的拍照识别功能仅支持“搜题”,无法在更多场景下使用。一些大模型应用甚至根本没有拍照选项,用户仅能通过输入文本与大模型交互。

然而,在日常工作和学习中,人们接触到的信息并不局限于纯文本。纸质合同、会议PPT、工作纪要等资料,如何才能让大模型帮助我们进行分析和整理呢?

讯飞星火通过其图文识别大模型,旨在从根本上解决这一问题。星火图文识别大模型具备对复杂板面的高精度解析,融合篇章语义的文字识别功能,以及覆盖多领域的专业符号识别等特点。借助该技术,讯飞星火可以实现对多媒体信息的深入理解,显著提高用户获取知识和学习的效率。无论是会议纪要、说明书、报纸还是书籍,都可以通过拍照快速得到大模型的识别与理解。

科大讯飞董事长刘庆峰说,经过多年积累,科大讯飞屡次在国际的图文识别、公式识别中获得大赛第一,为讯飞星火图文识别大模型的推出奠定了基础。

讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型

例如,科大讯飞针对大部分特定场景的图文识别做了专门优化,覆盖了书籍、学术论文、报纸、体检报告、PPT等31个工作生活中最常见的典型场景,并针对其中最常见的18个板面要素进行优化,可实现对诸如页眉、页脚、标题、表格等要素的快速识别和处理,甚至针对复杂的公式、印章、二维码以及手写等元素也能准确识别。

讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型

刘庆峰还介绍说,在英文公开测试集的图文识别效果对比中,星火图文识别大模型领先微软、Google等国际产品6个百分点。在诸如科研、金融、产品文档等典型应用场景的图文识别效果对比中,星火图文识别大模型均实现对目前公认实力最强的GPT-4V的超越。

讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型

星火图文识别大模型的加入,相当于给讯飞星火装上了一双“眼睛”。现实生活中看到不明白的内容,随手一拍就能求助大模型。一份报纸信息过多,一键拍照让大模型来帮你整理要点,获取知识的门槛和便利程度都大大提高。签订的租房合同看不出漏洞,拍给大模型一键帮你指出风险条款,让你也能化身法律专家。

越来越多的从业者已经认识到,多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环,可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃,为未来大模型应用提供了更大的想象空间。

根据国家互联网信息办公室,截至今年3月,中国已备案的大模型已经达117家。预计在不远的将来,越来越多的国产大模型将致力于多模态内容的开发,使大模型技术真正融入人们的日常工作和学习中。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-29 23:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
4月26日,讯飞星火大模型V3.5(以下简称“讯飞星火”)春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够把各种信息来源的海量
2024-04-26 11:44:00
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0 Turbo
2025-01-15 15:07:00
科大讯飞星火大模型将上新
4月28日消息,科大讯飞周六在互动平台透露,公司将于5月在京东、天猫等电商平台上新搭载星火大模型的语音台历,具备更广泛的知识覆盖、更强的理解能力及更自然的人机交互。这款语音台历产
2024-04-29 02:51:00
讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理
...内容,也同样开始遭到不耐烦的对待。然而,伴随着科大讯飞星火大模型V3.5功能上新,这个痛点终于要被解决了!近日,科大讯飞针对星火大模型V3.5版新增了多项“杀手锏”级功能升级
2024-04-30 19:00:00
讯飞星火赋能千行百业,科大讯飞亮相世界智能产业博览会
...世界智能产业博览会在国家会展中心(天津)举办,科大讯飞受邀参展,在人工智能展区,重点展示了讯飞星火大模型及其落地医疗、教育、工业、C端硬件等多行业领域的最新应用成果。科大讯飞
2024-06-21 10:19:00
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆包、月之暗面的 Kimi 等诸多大模型应用都已在应用商城上架。如此众多的大模
2024-04-30 17:00:00
“AI+”持续赋能千行百业,科大讯飞连续七年参加数字峰会
...力”为主题的第七届数字中国建设峰会在福州开幕。科大讯飞连续七年“满勤”参会,带来讯飞星火大模型V3.5及其在城市、医疗、工业等领域的落地成果,多款C端硬件产品亮相。科大讯飞董
2024-05-25 12:21:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
作者|武静静编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在
2024-01-31 07:32:00
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
讯飞星火APP/Desk全新升级,发布“个人空间”,打造更懂你的AI助手;讯飞晓医APP升级,上线个人数字健康空间,打造每个人的健康助手;业界首发星火智能批阅机,“AI助教”助力
2024-06-28 08:49:00
更多关于科技的资讯: