• 我的订阅
  • 头条热搜
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...跑大模型的个人PC。还有谷歌20亿追投Anthropic,并曝光多模态模型Gemini和工具Stubbs,将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报,实现23%的营收增长,是公司自2021年三季度以来最大的营收增幅,表现亮眼。部...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...进行统一的处理。在本文中,研究者通过提出创新型的多模态模型架构,以及统一的物理可解释动作空间,来解决这些挑战。设计 RDT:双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
骁龙 8 至尊版到底有多强?我们总结了三大关键问题
...程,减少游戏中1%fps卡村,同时改善手机发热的状况。多模态AI支持有什么意义? 简单来说,指令无需预处理,响应更快速。在骁龙8至尊版中,高通通过升级的HexagonNPU和AI引擎,进一步增强了设备端AI的多模态处理能力。这意味...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀:豆包视...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...。 首先,提升了整体性能,尤其在数学、长文本以及多模态方面。在MMLU-Pro上性能提高约7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-previe...……更多
谷歌 Astra 智能眼镜登场:融合多模态 AI 与 AR 技术
IT之家 12 月 17 日消息,谷歌 DeepMind 网站已为 Project Astra 项目开设了新的测试频道,计划邀请部分用户,测试配备 AI 和 AR 技术的原型眼镜,以便于进一步收集用户反馈、推进该眼镜商用落地。图源:谷歌 在系统方面,消息称...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调。多模态大语言模型(Multi-modal Large Language Models, MLLMs)以文本模态为基础,将其它...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
筑牢湾区网络安全防线!Coremail亮相大湾区网络安全大会
...进一步提升钓鱼邮件检测能力。 与文本大模型相比,多模态大模型能够处理更丰富的信息数据源,如文本、图像、音频等,不仅能进行文本理解,还能模拟视觉分析,处理图片和链接落地页等多媒体内容,为钓鱼检测提供更全...……更多
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练,就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造,基于新的编解码器架构C-V...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型(LMM)。多模态指AI模型不仅能够接受文本输入,还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM,其支持文本、语音和...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...大模型以及丰富第三方模型(如Llama、百川等)。支持多模态模型服务,提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中,通义方面发布了最强开源模...……更多
“什么值得买”助力提升海螺AI消费决策体验:输出垂类能力,建设融合生态
...自行研发的万亿参数大模型abab6.5,面向C端用户打造的多模态智能产品,支持文本、音频和图像的自由交流。海螺AI不仅具备强大的长文本处理能力和多格式文件支持,其高效大模型支持和多模态技术方向更能为用户提供多种服...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
每日与世界30亿次交互!这家AI独角兽企业发布视频、音乐生成模型
...字交互只是很小的一部分,更多的是语音和视频交互。多模态的内容,比如声音、图文和视频,已经成为信息传递的主流。为了能够提高渗透率,多模态是必经之路。”闫俊杰透露,目前video-01只提供了文生视频,在未来产品会...……更多
全球3809支队伍角逐 IKCEST第五届“一带一路”国际大数据竞赛在渝落幕
...。据了解,本届大赛从7月启动报名,以“社交网络中多模态虚假信息甄别”为题,要求选手通过构建同一事实跨模态数据之间的关系(文本和图像),实现对任一模态信息进行虚假和真实性的检测。中国工程院副院长、联合国...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...展现每一个动作的流畅过程。 语义遵从:业界首个以多模态大语言模型为文本编码器的视频生成模型,天然具备超高语义理解能力,在处理多主体及属性绑定等生成领域的难点挑战时表现出色。 原生镜头转换:多视角镜头切...……更多
科大讯飞股价跌停,市值蒸发120亿元
...升9%,其次是逻辑推理(8%),文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时,七大能力大幅度提升,其中语言理解能力提升78%,文本生成、知识问答、数学能力等提升也超70%,逻辑推理能...……更多
...还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音生成和数字人生成的结合。其实很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速,但是直播(...……更多
“试用完谷歌的新AI模型,再也不爱GPT”
...越 GPT-4 , Gemini 最特殊的一点是,它是谷歌带来的首个多模态大模型,也就是能不光能打字互动,也能进行语音、视频、图片的互动。按照谷歌的说法,现有的所谓多模态大模型,都是单独训练了文本、视觉和音频等模型,再把...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
被神话的 Sora ,被低估的多模态。Sora 终于来了!只要是 ChatGPT Plus/Pro 用户,直接就能用上。至于效果 ......看完官方放出的 demo,网友大呼:不太行 !当人们对「超级应用」的热情被 Sora 浇上一盆凉水时,多模态应用已经悄咪...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...,其架构如下图所示:CogSound的核心技术依托于GLM-4V的多模态理解能力,能够精确解析视频中的语义和情感,并生成匹配的音效。例如,在展示森林景观的视频中,CogSound能够生成鸟鸣和风吹树叶的声音;而在城市街景中,则会...……更多
...了图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。 基于阿里通义千问大模型,升级后的钉钉AI助理可以完成这些工作:进入AI助理对话框,发送长文件、在线文档、网页链接、视频...……更多
更多关于科技的资讯:
萍乡港华口腔医院院长林川博荣获BITC口腔种植大奖赛优胜奖
江西手机报萍乡讯(刘芳)8月2日,萍乡港华口腔医院院长林川博凭借在组织增量领域的出色表现,成功斩获北京BITC口腔种植大奖赛优胜奖
2025-08-04 15:31:00
8月1日,一家名为“三五而栗”的店铺正式开业,这家宣称“只招35+员工”的企业在引发社会广泛关注后,最终承诺未来保持35岁以上员工比例不低于70%
2025-08-04 11:19:00
据海关总署初步测算,上半年,中国跨境电商进出口约1.32万亿元,同比增长5.7%。其中,出口约1.03万亿元,同比增长4
2025-08-04 11:25:00
当前,新一轮科技革命方兴未艾,通用人工智能、新能源、大数据等前沿技术正深刻改变着工业生产全流程,为各领域、各产业探索新场景
2025-08-04 11:45:00
产业链上的山东好品牌 | 阳信县:小县城崛起针状焦产业“大巨人”
大众网记者 黄新宇 通讯员 陈瑞 朱超峰 滨州报道在山东北部,一座曾以农业为主的县城——阳信县,正以“针尖”之力撬动全国炭素新材料市场
2025-08-04 11:52:00
aigo爱国者精彩亮相2025政法展,以科技赋能推动智慧法治新进程
2025年7月25日,为期两天的2025政法智能化建设技术装备及成果展在北京国家会议中心圆满落幕。作为政法领域极具影响力的年度专业盛会
2025-08-04 11:57:00
大众网记者 郑健 潍坊报道在新科技革命迅猛发展、创新浪潮不断涌现的今天,企业想要求生存、求发展,唯有突破技术壁垒与专利封锁
2025-08-04 12:38:00
权威专家团免费在线问诊,“未来医生”正式上线
2025年8月2日,医联集团正式推出 “未来医生”权威专家在线问诊免费医疗服务。让专家问诊,从“难约”到“免费”在“未来医生”
2025-08-04 13:02:00
喜茶携手大热IP《CHIIKAWA》,带来夏日限定治愈体验
近日,喜茶官宣了与大热IP《CHIIKAWA》的联名合作,引发广泛关注。这是喜茶2025年来首个联动项目,也是近年来走红的《CHIIKAWA》的首个中国大陆茶饮品牌合作
2025-08-04 13:03:00
今年盛夏,全国高温持续,多地气温屡破历史极值,空调市场销售火爆。据权威机构GfK中怡康监测数据显示,空调行业线上销售额同比飙升50%
2025-08-04 13:31:00
大学生机器人大赛上演“比舞”大会 前八名将登陆“冰丝带”参加世界人形机器人运动会外围赛
机器人盛装出场 摄影/本报记者 宋霞近日,2025年华北五省(市、自治区)大学生机器人大赛舞蹈专项赛在北京信息科技大学举行
2025-08-04 13:58:00
搜狐Q2总收入1.26亿美元 净亏损同比收窄超40%
2025年8月4日,搜狐公司公布2025年第二季度财务报告。搜狐第二季度总收入为1.26亿美元,净亏损净亏损同比收窄超40%
2025-08-04 13:58:00
在2025年的按摩椅推荐榜单中,艾力斯特凭借其创新科技和卓越体验,稳居按摩椅品牌排名前列。今天,我们重点推荐三款艾力斯特旗舰机型——M6超凡大师
2025-08-04 13:02:00
大辰学员上岸分享,从失业焦虑到低空行业新星,95后女孩的3个月破局之路
01 | 失业回老家,刷到“人生转折点”2023年12月,dangdang拖着行李箱回到老家。此前,她在北京某互联网公司做前端开发
2025-08-04 13:02:00
今夏遛娃天花板!奈尔宝x抖音心动大牌日打造沉浸式\
暑期遛娃何处去?奈尔宝打破“游乐场”刻板印象,用互动带教课堂+职业角色扮演解锁成长新体验!借势抖音“心动大牌日”,打造线上线下联动的玩+学盛宴
2025-08-04 13:02:00