• 我的订阅
  • 头条热搜
厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?
...型榜单客观能力评测中排名第一(2024年1月);在腾讯多模态大模型榜单中排名第一(2023年11月)。事实上,在过去十年里,许多AI头部企业的主打产品都有思源大模型团队的技术加持。目前,思源大模型团队已与华为、腾讯等...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多
...五维内容引擎:构建结构化数据植入、语义关联优化、多模态适配、实时知识更新、竞品动态拦截技术体系,支持文本、视频、语音搜索协同优化。某新能源汽车品牌通过该引擎,在AI平台的“家庭实用场景”关键词曝光率激增8...……更多
OpenAI CEO又创办了一家AI健康公司
...关产品,多项测评超GPT-4o商汤发布日日新5.5,包括流式多模态交互的5o版本,多项测评超GPT-4o,还推出了端侧大模型和相关产品。 商汤现场演示了日日新5o的实时音视频交互能力,还推出了可控人物视频生成AIGC产品Vimi。商汤推...……更多
百度史上最好!文心大模型4.5/X1正式发布:免费用
...模型4.5和文心大模型X1。文心大模型4.5是百度首个原生多模态大模型,多模态理解、文本和逻辑推理能力提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%。百度创始人李彦宏此前表示,文心大模型4.5将是百度有史以...……更多
金域医学域见医言大模型正式发布,提速智慧医检4.0时代
...“六边形战士”,能够做到多模型整合、多场景赋能、多模态与多组学数据处理、多元知识充分融合、基于全病程信息多轮互动,不仅仅具备知识问答、智能化检测结果整合的功能,还具备医学领域的专业分析、推理能力。 金...……更多
...四川省两会新闻报道的专业大模型。“Chat两会”通过多模态理解、内容生成、智能交互的AI核心能力,提供“智库型”两会热点问答服务。智能对话、深度交互,不少代表委员感叹,这个工具“太香了”。“Chat两会”也获得AI业...……更多
智源研究院发布FlagEval“百模”评测结果
...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速,涌现了不少新的厂商与新模型,语言模型发展相对放缓。模型开源生态中,除了持续坚定开源的海内外机构,还出现了新的开源贡献者。语言模型,针...……更多
出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0
...、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
DeepSeek R1赋能爱尔眼科“爱科(Eyecho)”数字人 驱动智慧医疗新突破
...。术后陪伴数字人:通过手机端提供视频、语音及文本多模态服务,为术后患者定制个性化康复方案,实现长期眼健康管理。自发布以来,爱尔数字人“爱科(Eyecho)”已在集团总部及旗下多家医院投入使用,并亮相多个国际国内...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型:让中国文化“活”起来“...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模型技术增长没有放缓的趋势,Scal...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
一脉阳光与讯飞医疗达成战略合作:驱动医疗AI深度落地
...5万家基层医疗机构,其医疗大模型已在诊断准确率、多模态数据处理等领域建立技术壁垒。公司于2024年12月在香港上市,成为医疗大模型第一股。此次合作的深层背景,是当前中国医疗体系中基层医疗建设的工作重点。2024年6月...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
谷歌chrome地址栏整合gemini聊天机器人
...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态,具备跨模态推理能力,包括文本,图像,视频,音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大,适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多
谷歌最强小屏旗舰!谷歌Pixel 9发布:5700元起
...器,这是谷歌团队定制的一颗旗舰芯片,是谷歌首款以多模态运行Gemini Nano的处理器。 官方介绍,对多模态的支持意味着谷歌Pixel 9系列不仅可以理解文本,还能理解图像、音频和语音。其它参数方面,谷歌Pixel 9前置1050像素,...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...成模型还有三个亮点。1、文本编码器部分,已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器,适配的主要是上一代语言模型,如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模型Hunyuan-DiT中适配的是T5和C...……更多
涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式
...AIoT平台与DeepSeek等AI大模型融合,通过自然语言处理、多模态场景感知等前沿技术,推动设备向“主动智能”升级,从而为AI应用的落地开辟了新路径。 【宠物养护场景】 (图片由AI生成)此次,《全球智能商业》便将聚焦“宠...……更多
澳鹏全新推出一站式文档智能识别解决方案
...方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据,如文本、插图、公式、表格等,并支持对不同版面进行识别和还原。澳鹏一站式文档智能识别解决方案集成了多种算法能力:首先使用版面识别算法,可识别...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
ocr图片识别技术在智慧城市建设中的应用
...用将不断深入,提高字符识别的准确率和效率。(二)多模态数据融合OCR技术将与其他传感器技术相结合,实现多模态数据的融合,提高城市管理的智能化水平。(三)云计算技术的应用OCR技术将与云计算技术相结合,实现数据...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
星火大模型v3.5发布,带来七大能力提升
...为教师的“AI助手”。据官方介绍,星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”,教师使用粉笔在智慧黑板旁边的传统黑板上书写时,板书内容可以同步...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证 【盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电,盛视科技在互动平台表示,公司基于多...……更多
数坤科技打造全链路多模态智能卒中方案,引领医疗健康产业创新发展
...为卒中领域的发展带来了崭新的机遇。通过打造全链路多模态智能卒中方案,数坤科技引领卒中诊疗进入新时代。数坤科技智能卒中方案:全链路多模态助力卒中,作为全球范围内最为常见且危险的脑血管疾病之一,每年都在给无数...……更多
更多关于科技的资讯:
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00
2025教室节能照明标杆盘点 四大品牌绿色护眼解决方案解析
在“双碳”目标引领下,校园节能改造成为教育领域绿色发展的重要方向。据住建部统计,商业建筑能耗中照明系统占比高达35%,学校作为人员密集
2025-12-06 16:09:00
海尔智慧家电亮相迪拜
11月26日至28日,中东地区极具影响力的家电电子展在迪拜世贸中心举办。展会中,海尔智家针对当地高温、多尘等特点,集中展示了洗衣机
2025-12-06 16:10:00
12月1日,豆包手机助手技术预览版正式发布,首发搭载于中兴Nubia工程样机。豆包手机助手是以豆包APP为基础,与手机厂商在操作系统层面合作开发的AI助手软件
2025-12-06 17:41:00
文化中国行|全场听觉无死角 吉林省音乐厅声学揭秘
历经修缮重生的丰乐剧场,以“吉林省音乐厅”之名即将绽放春城。这座历史建筑,从伪满时期影剧院到音乐剧场的跨越,背后藏着一套极致考究的声学设计方案
2025-12-06 18:41:00
伊贝格:让机床行业不再为“头”烦恼
“关键核心技术与高端装备对外依存度高”一直是制约制造业升级的瓶颈。五轴联动铣头作为五轴机床的核心功能部件,过去很长一段时间被欧洲部分知名厂商垄断
2025-12-06 22:07:00
山东重工潍柴集团2026年商务大会圆满召开
鲁网12月6日讯12月6日,以“乘势向上 聚力向新”为主题的山东重工潍柴集团2026年商务大会在潍坊举行。山东重工集团党委书记
2025-12-06 22:43:00