• 我的订阅
  • 头条热搜
...模型”,其拥有150+亿参数量,具有行业化、轻量化、多模态的特点,支持包括文本类生成、视觉类生成等多模态应用,是一款更懂制造业的行业大模型。不同于ChatGPT这类依托于公开互联网数据的通用预训练大模型,创新奇智工...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
...还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音生成和数字人生成的结合。其实很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速,但是直播(...……更多
蚂蚁数科能源电力时序大模型EnergyTS发布 预测精度超谷歌、亚马逊
...大模型技术创新带来了传统行业的变革机遇,大模型的多模态感知理解能力将引发新交互、新服务,AI链接物理世界成为可能。在新能源领域,新能源光伏和风力发电环节,容易受到太阳辐照、风速、云量、温度、设备性能等多...……更多
...征点的三维模型快速匹配系统高逼真数字人快速构建与多模态交互系统虚拟空间创作平台3D沉浸式实时通信系统3D实景地图平台基于文本描述的3D场景生成系统元宇宙数字身份标识技术解决方案人形机器人揭榜挂帅任务榜单:全身...……更多
商汤营收恢复增长,亏损收窄至43亿元;CEO徐立回应DeepSeek影响
...国内外大模型仍在技术和应用层面加速竞争。对于押注多模态的商汤来说,仍需要考虑如何在继续加大技术投入和加速规模化应用方面实现更好的平衡。生成式AI业务撑起增长重任,研发投入增长19%商汤去年的营收打破了此前连...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...后他们基于此开发了智能体 Agent K v1.0,并让其参加了多模态 Kaggle 竞赛。最终 Agent K v1.0 获得了相当于 6 金 3 银 7 铜的成绩,成为首个达到 Kaggle Grandmaster level 1 的 AI 智能体。 论文标题……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...你也能化身法律专家。越来越多的从业者已经认识到,多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环,可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃,为未...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...超过90%。在启用视觉感知能力的情况下,o1模型在MMMU(多模态理解)测试中获得了78.2%的高分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT...……更多
3岁智能人“通通”入选中关村论坛重大科技成果
...于认知架构,由价值和因果驱动的自主智能,能够通过多模态交互达到价值与人类对齐,具备透明、可解释的推理和决策过程。朱松纯告诉记者,“通通”的日常学习与训练使用不超过10块A100芯片,这意味着“通通”不依赖庞大...……更多
吴泳铭官宣3800亿投入后,阿里云如何打AI这场硬仗?
...要的方向主要是两个,一个是Reasoning推理,一个是Omin全模态融合。”刘伟光提到。在应用方向上,这次大会,阿里云宣布推出AI Agent Store,从生成式AI向代理式AI发展,并表示将首先推动阿里旗下所有服务走向Agent(智能体)。此...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...场,隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出...……更多
赋能煤矿人工智能建设 “太阳石矿山大模型”正式发布
...面进行建设。其中,数据资源层汇聚了煤炭行业海量的多模态数据,包括安全监测数据集500亿条、视觉图像数据集300万张、包括20本期刊与200亿字技术文献的专业学术期刊数据集等;算法模型层可支撑自主可控的100+各类AI算法;...……更多
...出前10详情见下表: 三、机构观点① 游戏新品上线+AI多模态模型赋能,游戏板块或迎来业绩与估值双轮驱动开源证券认为,海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
...消化内科程斌教授团队开发了一款针对胰腺肿瘤诊断的多模态AI模型,可基于患者的临床信息与超声内镜图片,对胰腺占位作出诊断。相关研究成果于近日发表在国际期刊《JAMA Network Open》。胰腺癌是胰腺肿块的常见原因,超声...……更多
AI更有感情色彩!星纪魅族宣布:深度接入阿里云全模态大模型Qwen2.5-Omni
...(COO)廖清红宣布,公司将深度接入阿里云首个端到端全模态大模型Qwen2.5-Omni,这一举措将显著提升星纪魅族产品的AI情感理解能力。通过此次合作,星纪魅族能够在复杂任务中提供更智能、更自然的反馈与决策,标志着公司在A...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...型GPT-4o,现已在AzureAIStudio中提供,并作为API提供。该多模态模型集成了文本、图像和音频处理能力,带来了全新的生成式和对话式AI体验。此外,由微软开发的Phi-3列AI小型语言模型(SLM)中的一种新型多模态模型Phi-3-vision现已...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
...公告,中国第一汽车股份有限公司申请一项名为“副车架模态计算有限元建模方法、装置、终端及存储介质“,公开号CN117216865A,申请日期为2023年7月。专利摘要显示,本发明属于汽车技术领域,具体的说是一种副车架模态计算...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
多模态概念持续活跃 苏州科达3连板 【多模态概念持续活跃 苏州科达3连板】财联社12月11日电,多模态概念持续活跃,苏州科达3连板,宣亚国际大涨超10%,引力传媒、力盛体育、因赛集团等跟涨。消息面上,Google Al大模型Gemini...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...两个非常重要的特性:首先,语言区域表现出输入和输出模态的独立性,这是表征抽象性的关键特征。主要表现为在理解过程中,这些大脑区域对跨模态(口头、书面或手语)的语言输入做出反应。同样,在语言生成过程中,无...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
Manus和DeepSeek的差别是什么 谁更厉害:一文秒懂!
...用成本仅为同类产品的1/15,支持企业级规模化应用。多模态兼容:可处理高分辨率图像输入,但视觉模块尚未完善。Manus:执行型“全能打工人”技术架构:采用多智能体协作架构,通过虚拟机运行子Agent,整合工具链(如浏览...……更多
更多关于科技的资讯:
12月10日,公测仅23天月活突破3000万后,千问APP正以周为单位快速迭代,意在打造全能“办事”助手,即日起向所有用户首批开放AI PPT
2025-12-10 15:04:00
存量博弈下,潍柴如何用服务增值让客户体验与企业增长双向奔赴?
鲁网12月10日讯当发动机及装备制造业迈入存量竞争深水区,新能源与智能化技术加速迭代,客户需求越来越高,后市场服务早已超越了简单“售后服务”的范畴
2025-12-10 11:25:00
杭州造火箭了!最快明年首飞,“半小时全球直达”
火箭不仅可以向太空发射卫星,还可以送洲际快递,甚至可以建造太空城实现“太空旅居”?这个听起来充满未来感的愿景,正在杭州迈出第一步
2025-12-10 12:19:00
望海康信荣膺国家级专精特新“小巨人”企业称号
近日,望海康信(北京)科技股份公司成功入选北京市第七批专精特新“小巨人”企业名单,荣获由工业和信息化部认定的国家级专精特新“小巨人”企业称号
2025-12-10 12:05:00
图达通港股上市,黄山市深度投资,助力汽车产业升级发展
大皖新闻讯 2025年12月10日,全球顶尖激光雷达制造商图达通正式在香港联合交易所挂牌上市,截至上午10点30分,涨幅50%
2025-12-10 11:32:00
大皖新闻讯 屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 10:20:00
100天倒计时|于变化中锚定成长,来京宠展驭见2026
十二年为一纪,自2014年破土而生,北京万耀雄鹰国际展览有限公司举办的京宠展已悄然走过它的第一轮春秋,我们看着行业从青涩走向成熟
2025-12-10 10:43:00
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00