• 我的订阅
  • 科技

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

类别:科技 发布时间:2024-04-30 19:00:00 来源:驱动中国

三万多字的行业报告,九十余条的合同细则,一百多页的技术白皮书,一小时的采访录音,两小时的会议视频……当你在日常的工作与学习中遇到这些材料时,你会怎么做?如果按照以前的处理流程,必然是先口吐芬芳抱怨几句,然后硬着头皮按部就班的从头到尾提取你需要的信息。

事实上,“太长不想看”已经成为了快节奏生活和海量信息时代交织后人们最为典型的心理特性,不仅仅是刚才提到的那些枯燥乏味的内容材料,哪怕是长篇小说、娱乐视频等等本身兴趣方向浓厚的内容,也同样开始遭到不耐烦的对待。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

然而,伴随着科大讯飞星火大模型V3.5功能上新,这个痛点终于要被解决了!

近日,科大讯飞针对星火大模型V3.5版新增了多项“杀手锏”级功能升级,其中包括了对长文档、长图文、长音频和视频的支持,可以快速精准解析上述材料内容,用户可以直接以问答形式提炼内容并获取自己需要的信息,大大提升工作和学习效率。接下来,不妨跟随我们的测试一起来了解一番。

长文档测试:海量文本高效解析 革新传统处理方式局限

从ChatGPT开始进入大众视野起,通用大模型基本上是依照对话式的交互思路发展,但是token能力在很大程度上限制了应用场景,即便国内有大模型平台已经开始支持文档功能,但是依然存在诸如文件体积以及解析识别能力上的束缚。

星火V3.5版在长文档方向上的先进性不仅仅是在于支持的文档体积已超越常见规模,并且星火V3.5兼容格式以及处理效率、精准度等方面也堪称首屈一指,可以很好的兼容PDF、Word以及TXT等多种文本形态,操作体验上也更为简便化。

测试样本我们选择了一份由国家生态环境部和国家市监总局共同颁布的《汽油车排放物限定值及测量方法》,文件号为GB18285-2018,通俗点说,这份文件就是现行的汽油车新车下线和在用车年检尾气排放检测国家标准,整个国标文件共126页,文字数量长达几万字,如果按照常规的检索阅读方式,学习和查询都会耗费大量时间。

但是,通过星火V3.5的解析后,无论查询数据还是总结要点都轻而易举。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

测试过程中,我们先询问星火这份文件是否已经开始实施,显然在第一页较为明显处已经标注了新版尾气国标检测的印发和实施时间,所以星火给出的答案无误,而且从中可以看出,星火可以依照文档信息与当前时间进行综合获取和比对判断。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理
讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

随后我们开始加大难度,询问星火新版国标与早先版本存在哪些修订之处,这个问题看似简单,但隐藏着模糊之处,那就是啥叫早先版本?所以需要大模型拥有一定理解分析能力。不负所望的是,星火完整的给出了新版文件的修订内容,并清楚的依照文中信息罗列出来。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理
讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

那如果我要查询数据呢?随后我们询问有关检测限值指标的问题。同样星火能够依照引导给出全面的答案,包括一氧化碳、碳氢化合物以及氮氧化物在不同检测类型下的合格数值。

可见,单纯的文本检索性提问显然难不倒星火大模型V3.5,所以我们准备再提升一个难度量级,换英文版的文档。

第二份测试样本则是一份来自Winbond有关SPI NAND存储芯片的datasheet,这份文本不仅通篇英文,并且包含了大量专业术语,如果我们用中文提问,不仅考察了星火大模型V3.5对于英文长文档的分析能力,同时还要对中英文关于专业词汇和互换理解等硬指标提出要求。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

首先最简单的问题是有关于芯片的工作电压,然后是有关存储器的写入流程、指令以及注意事项,没想到的是,整个测试同样让我们喜出望外,尤其是关于注意事项部分,星火大模型V3.5准确的总结了文档中有关SPI NAND注意读写周期等待的问题,着实令人刮目相看。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理
讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

其实长文档的应用不仅仅限于我们现有的测试方式,它还可以应用到商务场景中,比如合同的检阅,厉害之处就在于其融合了法条逻辑判断,与星火合同助手融为一体,可以帮助用户审查合同的严密性,是否存在对某一方不利的情形,从而有效的完善合同,避免出现纠纷。

另外,它本身支持多份文件输入,这就意味着其同样拥有文件比对功能,尤其是在招标等场景下,可以实现智能审标的功能,检查投标方是否提交了完备的资质证明,以及在某些细节上是否具备资格等,可以有效的减少人工核对的工作量。

长音视频测试:业界首发 录音、视频不用转文字便可即问即答

这部分功能可以算得上是星火大模型独一无二的能力,目前国内先行的通用大模型平台均限于图像与文字,音视频内容作为问答素材目前也仅有星火大模型V3.5。而且该功能的文件支持范围极宽,不仅包含常规的MP3、MP4、AVI,而且还有WMA、WMV、RMVB、MOV、M4A等音视频格式,可以说目前常见的录制设备输出格式全部囊括在内了,如果不考虑码率等质量问题,时长在2小时以上显然不在话下。

音频文件我们选用了此前采访过某企业高管的录音,整个录音长度约20多分钟,因为是展会,声音相对嘈杂,还是比较有挑战性的。

提问方式依然是由简至难,首先是关于采访中提到了哪些产品,星火V3.5不仅清楚的给出了三款产品的型号,同时也总结了各个产品的特性。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

既然如此,我们直接用视频为素材,让星火V3.5来一篇关于其内容的新闻稿,而且还要带行业分析的那种,结果当然是没有问题的,而是通过这个演示我们能够看出,无论文档还是音视频,本身素材就已经是问题的材料和方向,这对于生产答案给出了更多便捷性和可能性。

视频测试我们使用了一段大约5分钟的采访视频,素材的质量与录音大致相当,并且受访者有一定的地域口音,但识别效果无疑是优秀的,通过抛出总结性的问题,星火V3.5同样给出了精准的答案,并且还给出了讯飞写作,一键成稿的功能指引,似乎星火V3.5也猜到了我们的工作属性。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

值得一提的是,不只是回答效果突出,在素材处理的效率上,星火V3.5也表现的非常出色。大体积的文档和音视频文件在上传后便可以直接开始提问,完全不需要等素材识别处理的过程,而且即便在问题给出后,整个回答的耗时也并没有比早先纯问答的形式慢多少,无需长时间的等待,星火V3.5便高效给出答复。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

另外不得不说的是,为了能够支持素材的传输和利用,此次星火V3.5还特意在大模型中提供了个人空间功能,也就是说,我们所上传的文档和音视频可以直接保存在云账户内,无论是需要日后继续查阅分析,还是更换到另一台终端上,这种个人空间的设计形式都提供了极大的便利性,也同样成为了目前通用大模型的首创形式。

长图文测试:精准识别手写材料 随手一拍也能随传随用

图文的意思就是包含文字内容的图片,与文档、音视频一样,是属于语言识别范畴,严格来说,长图文是先前AI视觉能力的延伸,为此讯飞单独将图文拿出来与图片区别开,成为独立的模式。

别看它只是图像识别的一个子集功能,但是应用范围和能力却明显高了一个维度。因为我们日常学习、工作中往往会拍摄大量的带有文字信息的图片,比如手机电脑的截屏,开会时的PPT,教授课堂上的板书,孩子的作业试卷,药品说明书等等,当我们需要从中提取信息并整理信息的时候,星火V3.5就能够通过强大的AI视觉文字识别和分析能力让整个过程事半功倍。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

这项功能的测试,我们首先使用了目前媒体传播最为流行的一种形式,叫做一图读懂,说白了就是“太长不想看”的图文版,我们现在的目的就是把图文版重新转换回到“太长不想看”。

我们选用了某手机厂商的官宣图片当作素材,然后用指令提取图文中有关特性总结的部分。因为整个图片的层次复杂度还是比较高的,需要AI视觉在一定程度上不能被各种其他图像和背景变化所干扰,然后提取的内容确保无误才能实现内容的扩充。

最终结果显然没有任何问题,同样我们也可以直接通过指令让星火V3.5直接用图文中的信息做一篇有关该手机产品的介绍文章。

那既然提到了板书、作业、笔记这类采用手写的图文形式同样可以实现上述功能,那么我们就不妨把难度放到较高的层面,直接用已经作答的英语试卷来作为提问的素材。

讯飞星火V3.5上新体验:直击办公学习痛点 升级长文档、音视频和图文处理

我们选择了一张书写还算规范的小学四年级英语试卷进行题面和作答的评判。星火V3.5不仅可以清楚的识别手写内容,还可以正确的分辨题目和答题区的区别和关系,并且有理有据的对作答内容进行了分析阐述,效果已经完全出乎我们意料。

不过,星火V3.5的图文识别并不是完美到无懈可击,我们在使用界限不是特别明晰的表格性图文作为素材的时候,星火V3.5会有一定的识别错误存在,所以我们也希望讯飞能够在接下来的版本继续加强星火大模型在AI视觉上的能力,将表格类图文表现进一步完善,以弥补我们此次体验中唯一的遗憾。

体验总结

事实上,星火V3.5升级点不仅这几项,同时在交互的情感能力以及CRM等办公场景的接入等方面都有了全新的提升,在此我们不再过多阐述。

从星火V3.5上新后的现有能力来看,其已经不是单纯提高算力,提升token的纵向升级,而是为用户带来了应用维度和应用场景等横向面上进行了更切合实际拓宽,进而真正的解决了用户痛点,释放AI效率的结果,实现讯飞与用户双向奔赴的效果。尤其是当下利用更丰富的素材支持来完善大模型工具化的方向,让我们媒体工作者更能从中感受到星火V3.5全新升级所带来的惊喜。我们也相信,在同样面对大量文本、音视频以及图文等各类资料的办公人士、学生群体等用户,也一样能够从早先繁复的传统处理方式中解脱出来,大受效率倍增之裨益。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-30 20:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...文档等识别效果都处于业界领先地位。此外,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键
2024-04-26 11:44:00
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...成初稿。首次发布的全要素创作模式,支持指令、文档与音视频内容等多种类型文件输入;通过采用多模型混合策略,智文能够智能规划生成路径,不同场景自动选择最优模型,让用户能够根据自身
2025-01-08 17:35:00
科大讯飞联手华为首次攻克全国产算力下推理模型训练难关
...提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。此外,作为国内智能翻译领域的佼佼者,科大讯飞还推出了业界首个具备端到端语音到语音同传能力的大模型——星火语音同传大模型
2025-01-15 15:07:00
科大讯飞gpt产品“讯飞听见会写”首次更新,导入word即可AI写作
...新闻稿件、编写品宣文案等。本次产品更新后,不仅支持音视频格式,更支持文档格式导入。据悉,该功能在文秘、新闻记者群体中大受欢迎,他们只需要将得到的文件内容和记录的片段信息导入讯
2023-06-09 17:00:00
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
作者|武静静编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在
2024-01-31 07:32:00
五大数字员工已上岗!讯飞星火让每个岗位都用上大模型
...慧驾驶舱、iCase会话智能五大产品,将星火V4.0与企业业务痛点相结合,形成了基座大模型升级与应用落地一脉相承的发展路径。 那么,这五大产品有哪些核心亮点?到底将星火V4
2024-07-01 09:24:00
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,
2024-01-30 22:41:00
八年满勤,数字中国讯飞答卷:AI如何让城市更聪明、生活更便捷
...传统办公中记录效率低、信息碎片化、纸质文档难管理的痛点,让开会记录、整理纪要、文件批注等场景实现“高效办公,一本搞定”。在展台一角,观众还能收获一份独一无二的纪念品——由AI
2025-04-30 12:36:00
“最懂你的AI助手”来了!讯飞星火大模型,成了打工人职场搭子?
...了两年,这次打工人真的可以解放双手了?6月27日,科大讯飞正式发布讯飞星火大模型V4.0,亮点非常多,八妹大致总结了一下:1、发布了多款新产品和应用,包括但不限于讯飞星火AP
2024-06-29 09:42:00
更多关于科技的资讯:
医渡科技大模型首次赋能医美,携手广附院推出“美易智能体”
今日,国内AI医疗头部企业医渡科技(2158.HK)对外宣布,公司与广东医科大学附属医院(以下简称“广附院”)联合打造的“脉管性疾病多模态专病数据库”
2025-08-12 19:07:00
全国AI机器科学家挑战赛启动 中国科大重点实验室发起
大皖新闻讯 日前,中国科学技术大学精准智能化学全国重点实验室发起的2025年度AI机器科学家知识还原探究挑战赛正式启动
2025-08-12 10:48:00
大模型为光伏板“筛”出万能质检模板——场景创新河北故事之三7月29日,英利能源发展有限公司(简称“英利发展”)位于蠡县的智慧光伏产业园一派忙碌
2025-08-12 08:46:00
河北新闻网讯(张纳军、张婧)“以前不管是不是生产急需用料,都需要同样报计划、走流程、等周期。现在,只要在申报计划时给物资标上‘A+’
2025-08-12 06:38:00
8月8日,俄罗斯最大电商平台之一Yandex Market在杭州举办华东地区首场官方卖家峰会,吸引了1500多名跨境电商从业者参与
2025-08-12 07:08:00
聚焦“5+5+5”产业体系 产业投资如何激发新增长点?
制图 田兰芳投资是可持续发展的推进器。进入发展新阶段,扩大有效投资,如何实现从“量”到“质”的提升,推动产业结构优化升级
2025-08-12 07:08:00
认得出身份,辨得清健康 走路会“报信”,一“步”识你□南京日报/紫金山新闻记者陈燕飞在不少影片里,戴面具、裹大衣就能躲过监控的桥段
2025-08-12 07:46:00
预计年均为经营主体降低投标成本超9000万元南京建成全省首个全行业智能招标投标交易系统南报网讯(通讯员宁数轩记者马道军)“过去跨行业竞标
2025-08-12 07:47:00
赶制出口订单 满足市场需求
8月11日,南京经开区长江工业炉科技集团工作人员正在赶制工业炉产品。据介绍,该企业产品涉及航空航天、军工医疗、汽车装备等领域
2025-08-12 07:47:00
江苏南京:“灵巧之手”叩开“未来之门”
拿捏鸡蛋很轻松、拎起刀子切水果、握住扳手拧螺丝……中科硅纪走上世界机器人舞台——“灵巧之手”叩开“未来之门”中科硅纪的通用智能灵巧手产品
2025-08-12 07:48:00
根据用户角色需求灵活配置,快速生成面向不同用户场景的应用画布。记者8月11日从太钢获悉,太钢集团智能运维平台管理驾驶舱——“千面云知”平台上线试运行
2025-08-12 07:06:00
「领航人计划」上海站:和颜一美携手艾尔建学苑共探医美技术新未来
8月的上海,一场聚焦医美技术革新与学术交流的盛会如期而至。和颜一美与全球医美领域权威机构艾尔建学苑,联合发起的“领航人计划”于8月6日在上海创新中心开启第一站
2025-08-11 11:49:00
从“功能刚需”到“悦己消费” 京东服饰《科学选文胸白皮书》解析文胸新趋势
8月7日,京东服饰《科学选文胸白皮书》发布会在北京举行。会上,最新发布的白皮书为女性消费者提供了科学、系统的文胸选购指南
2025-08-11 11:59:00
百果园董事长“教育消费者”言论引争议,其名下实控企业超90家
近日,“月薪2万吃不起百果园”相关话题引发关注。据浙江在线报道,社交媒体上,曾有不少网友吐槽。“太贵了,月薪2万吃不起
2025-08-11 12:28:00
胖东来发布关于招聘“刑释人员”说明:基于人性的善良和美好
近日,胖东来拟招聘刑释人员一事引发热议。8月10日晚,胖东来创始人于东来在社交平台发布关于招聘“刑释人员”的说明,进一步对此事作出回应
2025-08-11 12:28:00