模态,教会,文本,升级,数据,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

本周硅谷发生了什么？| 高通第三代骁龙8；谷歌20亿美元追投Anthropic；联想拿出能跑大模型个人PC

...跑大模型的个人PC。还有谷歌20亿追投Anthropic，并曝光多模态模型Gemini和工具Stubbs，将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报，实现23%的营收增长，是公司自2021年三季度以来最大的营收增幅，表现亮眼。部...……更多

2023-10-30 15:31:00高通,三代,硅谷,模型,个人,模型

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...进行统一的处理。在本文中，研究者通过提出创新型的多模态模型架构，以及统一的物理可解释动作空间，来解决这些挑战。设计 RDT：双臂机器人操作的新架构「模仿学习」是当前开发通用机器人模型的主流方法。即机器人通...……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

Soul上线自研大模型“SoulX”，AIGC+社交布局提速

...据训练，具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时，SoulX覆盖百种细粒度风险类别，通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多

2023-12-11 14:38:00提速,社交,布局,模型,社交,用户

骁龙 8 至尊版到底有多强？我们总结了三大关键问题

...程，减少游戏中1%fps卡村，同时改善手机发热的状况。多模态AI支持有什么意义？简单来说，指令无需预处理，响应更快速。在骁龙8至尊版中，高通通过升级的HexagonNPU和AI引擎，进一步增强了设备端AI的多模态处理能力。这意味...……更多

2024-11-04 22:04:00关键,三大,问题,高通,处理,任务

终于拿到内测！豆包-PixelDance真是字节视频生成大杀

...个面向不同细分领域（视频生成、音乐和同声传译）的多模态大模型，同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模型家族」。家族新秀：豆包视...……更多

2024-09-30 09:51:00豆包,字节,生成,视频,模型,豆包

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外

...。首先，提升了整体性能，尤其在数学、长文本以及多模态方面。在MMLU-Pro上性能提高约7%；而在 MATH 和 HiddenMath（内部保留的竞赛数学问题集）基准测试中，两种模型有约 20% 的显著改进，其中Pro版本以86.5%的成绩超过了o1-previe...……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

谷歌 Astra 智能眼镜登场：融合多模态 AI 与 AR

IT之家 12 月 17 日消息，谷歌 DeepMind 网站已为 Project Astra 项目开设了新的测试频道，计划邀请部分用户，测试配备 AI 和 AR 技术的原型眼镜，以便于进一步收集用户反馈、推进该眼镜商用落地。图源：谷歌在系统方面，消息称...……更多

2024-12-18 09:30:00模态,眼镜,智能,技术,眼镜,原型

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。多模态大语言模型（Multi-modal Large Language Models, MLLMs）以文本模态为基础，将其它...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

筑牢湾区网络安全防线！Coremail亮相大湾区网络安全大会

...进一步提升钓鱼邮件检测能力。与文本大模型相比，多模态大模型能够处理更丰富的信息数据源，如文本、图像、音频等，不仅能进行文本理解，还能模拟视觉分析，处理图片和链接落地页等多媒体内容，为钓鱼检测提供更全...……更多

2024-11-11 17:46:00湾区,安全,网络,防线,大会,邮件

AI潮起共筑数智之基

...大会上，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...基于预训练GPT-2提出了一种新的注意力机制，来衔接不同模态之间的语义差异，无需大量图像-文本数据训练，就能提升文本生成效率。文本-视频模型生成主要代表作有Phenaki、Soundify。Phenaki 由谷歌打造，基于新的编解码器架构C-V...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

推动终端侧AI发展 MWC2024高通带来多项全球首发

...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型（LMM）。多模态指AI模型不仅能够接受文本输入，还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM，其支持文本、语音和...……更多

2024-02-29 10:14:00高通,终端,发展,全球,高通,模型

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造，是（谷歌）通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示：Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...大模型以及丰富第三方模型（如Llama、百川等）。支持多模态模型服务，提供灵活高效易用的模型API与SDK。提供文本生成、图片生成、视觉理解、视频生成、语音识别以及语音合成能力。最新进展中，通义方面发布了最强开源模...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

“什么值得买”助力提升海螺AI消费决策体验：输出垂类能力，建

...自行研发的万亿参数大模型abab6.5，面向C端用户打造的多模态智能产品，支持文本、音频和图像的自由交流。海螺AI不仅具备强大的长文本处理能力和多格式文件支持，其高效大模型支持和多模态技术方向更能为用户提供多种服...……更多

2024-07-30 17:55:00海螺,输出,决策,生态,能力,体验

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V，声称只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

不要小看「实而不华」的腾讯 AI

...未来的战略思路。01模型侧：基础模型能力升级，构建多模态能力首先是基础模型方面，5 月 17 日的峰会上，腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中，最大模型已拓展至万亿级参数规模，并在 1B、3B、7B、13B 等不同参数量...……更多

2024-05-21 21:25:00腾讯,腾讯,模型,能力,广告,视频

每日与世界30亿次交互！这家AI独角兽企业发布视频、音乐生成

...字交互只是很小的一部分，更多的是语音和视频交互。多模态的内容，比如声音、图文和视频，已经成为信息传递的主流。为了能够提高渗透率，多模态是必经之路。”闫俊杰透露，目前video-01只提供了文生视频，在未来产品会...……更多

2024-09-04 13:45:00独角兽,生成,模型,世界,企业,视频

全球3809支队伍角逐 IKCEST第五届“一带一路”国际大

...。据了解，本届大赛从7月启动报名，以“社交网络中多模态虚假信息甄别”为题，要求选手通过构建同一事实跨模态数据之间的关系（文本和图像），实现对任一模态信息进行虚假和真实性的检测。中国工程院副院长、联合国...……更多

2023-11-07 18:40:00支队,第五届,一带,竞赛,数据,全球

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...展现每一个动作的流畅过程。语义遵从：业界首个以多模态大语言模型为文本编码器的视频生成模型，天然具备超高语义理解能力，在处理多主体及属性绑定等生成领域的难点挑战时表现出色。原生镜头转换：多视角镜头切...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

科大讯飞股价跌停，市值蒸发120亿元

...升9%，其次是逻辑推理（8%），文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时，七大能力大幅度提升，其中语言理解能力提升78%，文本生成、知识问答、数学能力等提升也超70%，逻辑推理能...……更多

2023-10-24 16:15:00跌停,讯飞,市值,股价,蒸发,讯飞

数字人替代真人直播的时代来临了吗？它需要哪些技术支持？

...还需要哪些技术支持？司马华鹏称：“我们的大模型是多模态的，是文本生成、声音生成和数字人生成的结合。其实很多人在反馈，他（刘强东）声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速，但是直播（...……更多

2024-04-21 22:43:00真人,直播,技术支持,数字,支持,时代

“试用完谷歌的新AI模型，再也不爱GPT”

...越 GPT-4 ， Gemini 最特殊的一点是，它是谷歌带来的首个多模态大模型，也就是能不光能打字互动，也能进行语音、视频、图片的互动。按照谷歌的说法，现有的所谓多模态大模型，都是单独训练了文本、视觉和音频等模型，再把...……更多

2023-12-12 00:22:00模型,模态,模型,答案,大杯,能力

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

AIGC工具测评：生成式AI的产品表现如何

...力上也有了重大突破。更值得一提的是，GPT-4引入了“多模态”功能，支持图像和语音输入，甚至可以输出图片，大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格，其简洁的设计语言和优化的...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

被神话的 Sora ，被低估的多模态。Sora 终于来了！只要是 ChatGPT Plus/Pro 用户，直接就能用上。至于效果 ......看完官方放出的 demo，网友大呼：不太行！当人们对「超级应用」的热情被 Sora 浇上一盆凉水时，多模态应用已经悄咪...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

...，其架构如下图所示：CogSound的核心技术依托于GLM-4V的多模态理解能力，能够精确解析视频中的语义和情感，并生成匹配的音效。例如，在展示森林景观的视频中，CogSound能够生成鸟鸣和风吹树叶的声音；而在城市街景中，则会...……更多

2024-11-09 09:54:00画质,音效,高清,国产,电影,生成

钉钉AI助理升级上线文档速读等功能

...了图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉AI助理可以完成这些工作：进入AI助理对话框，发送长文件、在线文档、网页链接、视频...……更多

2024-04-03 07:00:00助理,升级,功能,文档,助理,工作流

page 6/2667 首页上一页 1 2 3 4 567 8 9 10 11 下一页末页

更多关于科技的资讯：

萍乡港华口腔医院院长林川博荣获BITC口腔种植大奖赛优胜奖

江西手机报萍乡讯（刘芳）8月2日，萍乡港华口腔医院院长林川博凭借在组织增量领域的出色表现，成功斩获北京BITC口腔种植大奖赛优胜奖

2025-08-04 15:31:00

我们距“招35+”不是新闻还有多远-中国吉林网

8月1日，一家名为“三五而栗”的店铺正式开业，这家宣称“只招35+员工”的企业在引发社会广泛关注后，最终承诺未来保持35岁以上员工比例不低于70%

2025-08-04 11:19:00

跨境电商韧性不减

据海关总署初步测算，上半年，中国跨境电商进出口约1.32万亿元，同比增长5.7%。其中，出口约1.03万亿元，同比增长4

2025-08-04 11:25:00

索通发展郎光辉：以绿色智造破局再造“隐形冠军”新引擎

当前，新一轮科技革命方兴未艾，通用人工智能、新能源、大数据等前沿技术正深刻改变着工业生产全流程，为各领域、各产业探索新场景

2025-08-04 11:45:00

产业链上的山东好品牌 | 阳信县：小县城崛起针状焦产业“大巨

大众网记者黄新宇通讯员陈瑞朱超峰滨州报道在山东北部，一座曾以农业为主的县城——阳信县，正以“针尖”之力撬动全国炭素新材料市场

2025-08-04 11:52:00

aigo爱国者精彩亮相2025政法展，以科技赋能推动智慧法治

2025年7月25日，为期两天的2025政法智能化建设技术装备及成果展在北京国家会议中心圆满落幕。作为政法领域极具影响力的年度专业盛会

2025-08-04 11:57:00

潍坊昌邑荣信化工凭借“硬核”产品领跑行业

大众网记者郑健潍坊报道在新科技革命迅猛发展、创新浪潮不断涌现的今天，企业想要求生存、求发展，唯有突破技术壁垒与专利封锁

2025-08-04 12:38:00

权威专家团免费在线问诊，“未来医生”正式上线

2025年8月2日，医联集团正式推出 “未来医生”权威专家在线问诊免费医疗服务。让专家问诊，从“难约”到“免费”在“未来医生”

2025-08-04 13:02:00

喜茶携手大热IP《CHIIKAWA》，带来夏日限定治愈体验

近日，喜茶官宣了与大热IP《CHIIKAWA》的联名合作，引发广泛关注。这是喜茶2025年来首个联动项目，也是近年来走红的《CHIIKAWA》的首个中国大陆茶饮品牌合作

2025-08-04 13:03:00

海尔空调靠“强冷”登TOP2，8.7将发最新科技

今年盛夏，全国高温持续，多地气温屡破历史极值，空调市场销售火爆。据权威机构GfK中怡康监测数据显示，空调行业线上销售额同比飙升50%

2025-08-04 13:31:00

大学生机器人大赛上演“比舞”大会前八名将登陆“冰丝带”参加

机器人盛装出场摄影/本报记者宋霞近日，2025年华北五省（市、自治区）大学生机器人大赛舞蹈专项赛在北京信息科技大学举行

2025-08-04 13:58:00

搜狐Q2总收入1.26亿美元净亏损同比收窄超40%

2025年8月4日，搜狐公司公布2025年第二季度财务报告。搜狐第二季度总收入为1.26亿美元，净亏损净亏损同比收窄超40%

2025-08-04 13:58:00

2025按摩椅推荐：艾力斯特领衔按摩椅品牌排名，专利科技打造

在2025年的按摩椅推荐榜单中,艾力斯特凭借其创新科技和卓越体验,稳居按摩椅品牌排名前列。今天,我们重点推荐三款艾力斯特旗舰机型——M6超凡大师

2025-08-04 13:02:00

大辰学员上岸分享，从失业焦虑到低空行业新星，95后女孩的3个

01 | 失业回老家，刷到“人生转折点”2023年12月，dangdang拖着行李箱回到老家。此前，她在北京某互联网公司做前端开发

2025-08-04 13:02:00

$今夏遛娃天花板！奈尔宝x抖音心动大牌日打造沉浸式\$

今夏遛娃天花板！奈尔宝x抖音心动大牌日打造沉浸式"玩+学"新

暑期遛娃何处去？奈尔宝打破“游乐场”刻板印象，用互动带教课堂+职业角色扮演解锁成长新体验！借势抖音“心动大牌日”，打造线上线下联动的玩+学盛宴

2025-08-04 13:02:00

头条订阅服务