模态,从容,模型,能力,全球,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

“AI春晚”背后的故事

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今，仍然面临技术上的诸多挑战。瞄准这些“痛点”，智源研究院放了个大招。在北京智源大会上，涵盖大语言模型、多模态大模型、具身智能大模型...……更多

2024-06-16 23:38:00背后,故事,模型,智能,技术,研究院

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...张鹏则表示，对于Sora的出现，他并不吃惊，因为立足多模态领域的深耕，智谱也正在做这件事。如今，“清影”面世，让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态，也让没有视频制作基础的小...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

香港发布AI多模态手术大模型

...学院香港创新院AI中心”)，日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍，CARES Copilot系统由中国科学院香港创新院AI中心研发，是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多

2024-03-14 10:23:00模态,香港,模型,香港,中国科学院,人工智能

联汇科技荣登「AI中国」机器之心2022年度评选两大重量榜单

...联汇科技预训练大模型拥有国际领先的能力优势，自研多模态预训练大模型OmModel是全球最早一批基于大规模自监督学习的多模态人工智能算法之一，在ECCV 2022等多个顶会竞赛中领先谷歌、微软等技术团队取得多项冠军，大模型...……更多

2023-02-01 10:00:00联汇,之心,中国,重量,机器,年度

生成式AI大爆发后，2024年人工智能行业有哪些新趋势

...（人工智能）发展史的一个转折点，活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实，人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势，行业专家们也给出了一些...……更多

2024-02-12 12:33:00人工智能,人工,生成,趋势,智能,行业

语音能力再突破！讯飞星火语音大模型即将发布

...代码纠错、代码解释、单元测试生成5个维度升级，其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日，在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上，星火认知大模型V3.0...……更多

2024-01-29 15:57:00音大,讯飞,星火,语音,模型,突破

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造，是（谷歌）通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示：Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

7个第一，11个首发，讯飞星火放大招，大模型规模化落地可期！

...有的远场高噪、全双工、多语种多方言能力上，升级了多模态能力，新增了超拟人和个性化能力。超拟人数字人首次亮相，多模态的交互从超拟人的语音变成超拟人的数字人，实现语音、视频、图文的全部联动的多模态交互。 ...……更多

2024-10-24 16:48:00讯飞,星火,落地,模型,规模,讯飞

IKCEST第五届“一带一路”国际大数据竞赛获奖名单出炉重

...上游新闻记者在现场了解到，本届大赛以“社交网络中多模态虚假信息甄别”为主题，要求选手通过构建同一事实跨模态数据之间的关系（文本和图像），实现对任一模态信息进行虚假和真实性的检测。本届大赛共吸引全球3809...……更多

2023-11-07 21:00:00特等奖,重庆,获奖名单,第五届,邮电,一带

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...Qwen-VL-Plus，与GPT-4V正面硬刚，这个有着SOTA级别性能的多模态大模型真正做到了“人无我有，人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后，2024年1月31日，微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

Bengio团队提出多模态新基准，直指Claude 3.5和

...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...一款名为 LVAFusion 的模块，旨在更高效、更准确地融合多模态信息。图 | 徐冬阳（来源：徐冬阳）自动驾驶在路上应该具备学习优秀人类驾驶员的能力，因为人类在面对多数场景的时候，可以迅速地定位在关键区域。为了提高端...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

李未可科技创始人茹忆：WAKE-AI，多模态大模型带来的智慧

...论坛中，李未可科技创始人兼CEO茹忆发表了《WAKE-AI：多模态大模型带来的智慧文旅变革》的主题演讲，分享了自己关于人工智能和AI硬件的看法。茹忆指出，随着大模型的不断发展，基于人工智能的交互方式正从单一的语音和视...……更多

2024-05-23 09:17:00模态,创始人,模型,智慧,科技,模型

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

...参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。用户可在魔搭社区直接体验Qwen系列模型效果，也可通过阿里云灵积平台调用模型API，或基于阿里云百炼平台定制大模型应用。...……更多

2023-12-01 13:33:00通义,模态,模型,尺寸,参数,模型

“不要卷模型，要卷应用！”李彦宏谈AI：大模型公司热衷于写高

...，拥有高度仿生的躯干构型和拟人化的运动控制，支持多模态机动、多模态感知、多模态交互和多模态操控，全身多达43个主动自由度，最大关节峰值扭矩400N.m，算力支持400TOPs。图片来源：上海证券报运动能力上，“青龙”人...……更多

2024-07-04 17:34:00模型,李彦,作文,不大,价值,高考

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...示，这个生成速度在业内已经算非常快了。张鹏认为，多模态模型的探索还处于非常初级的阶段。从生成视频的效果看，对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等，都有非常大的提升空间。从模型本身角度...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

讯飞星火V3.0发布，打造每个人的AI助手

...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力，进一步提升星火的落地应用能力。升级AI人设、启发式对话，打造每个人的AI助手自讯飞星火9月5日全民开放后，当前已有1200万用户，也...……更多

2023-10-24 15:02:00讯飞,星火,助手,讯飞,星火,模型

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...）创新性地推出了“一体两翼”产品矩阵，包括自研的多模态知识引擎与行业通用智能体平台，致力于构建未来通用人工智能（AGI）时代的核心数据基础设施，为企业提供大模型与知识引擎双轮驱动的解决方案。枫清·天枢多模...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

北京智源研究院创始人张宏江：大模型背后的核心是一个新的操作系

...源研究院创始人、创始理事长张宏江表示，今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察，可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶...……更多

2024-03-25 20:31:00张宏,北京,创始人,研究院,模型,背后

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中，「天工3.0」超越GPT-4V，全球领先。（天工3.0多模态性能超越GPT-4V，全球领先）同时，「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

松鼠Ai智适应教育大模型全新升级

...与科技融合的盛宴。松鼠Ai举行发布会，不仅展示了其多模态智适应教育大模型及系统的全方位升级，还推出了多款前沿的智适应教育硬件产品，为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多

2024-06-19 10:57:00松鼠,模型,全新,升级,教育,松鼠

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...事实性以及推理能力的缺陷，实现更精细的语义理解、多模态（文本、图像、语音、视频等）输入和输出，具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能，实现AI的自我解释、自我评测和自我监督，构建...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...—亚马逊CEO Andy Jassy亲自站台re:Invent24，发布自家新款AI多模态系列大模型，名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成，甚至直接吐露一个小目标：将来我们不仅要Speech to Speech，更要Any-to-Any！整体而言，Am...……更多

2024-12-05 09:45:00模态,一口,芯片,模型,一口气,亚马

从技术变革到生态协同报告总结人工智能产业发展十个趋势

...事业”。报告总结出人工智能产业发展十个趋势，即：多模态预训练大模型是人工智能产业的标配；高质量数据愈发稀缺将倒逼数据智能飞跃；智能算力无处不在的计算新范式加速实现；人工智能生成内容应用向全场景渗透；人...……更多

2023-12-06 22:32:00人工智能,产业发展,变革,人工,生态,趋势