强悍,模型,模态,模型,训练,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

反击OpenAI，谷歌放出最强悍大模型Gemini

...之久的GPT4真正竞品，也是目前谷歌能拿出手的功能最为强悍、适配最为灵活的大模型，包括三种不同套件，分别是Gemini Ultra, Gemini Pro和Gemini Nano。其中Ultra的能力最强，复杂度最高，能够处理最为困难的多模态任务；Pro能力稍弱...……更多

2023-12-07 10:31:00强悍,模型,模态,模型,训练,能力

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...模型。研究人员表示：“DeepSeek-VL 1.3B 小模型的性能同样强悍，在部分指标上超越了 7B 模型。” 这些小模型可以满足算力缺乏型开发者使用，也更方便在手机等移动终端上部署。日前，相关论文以《DeepSeek-VL：面向真实世界的...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...件协同，充分挖掘芯片潜力，确保大模型在端侧运行时的强悍性能。未来，vivo计划开放成熟算法能力与端侧加速能力，与行业开发者合作，共同打造创新、便利、智能的业务场景，为用户提供更优质的智能化体验。攻克AI三大挑...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...其进行微调，以进一步提升其能力。在性能上，Gemini相当强悍。Google放出了一系列测试结果，从自然图像、音频和视频理解到数学推理，在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准上，Gemini Ultra的性能在30项上都...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

全模态对齐框架align-anything来啦：实现跨模态指

...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作，包括 Aligner（NeurIPS 2024 Oral）、ProgressGym（NeurIPS 2024 Spotlight）以及 Safe-RLHF（ICLR 2024 Spotlight）等系列……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

首个多模态连续学习综述，港中文、清华、UIC联合发布

...态连续学习的最新进展连续学习（CL）旨在增强机器学习模型的能力，使其能够不断从新数据中学习，而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘：当任务按顺序训练时，新的任务训练会严重干扰之前...……更多

2024-11-14 09:46:00模态,清华,中文,联合,学习,模态

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。文本...……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

大模型「标王」硬气：不做Sora ，要帮更多企业做出Sora

...u 文生视频一句话，召唤出 3D 世界。哇嘶嗒（VAST）文生3D模型一个创意、一键生成，短短五分钟，一段品牌宣传片便能完美呈现。手机，也能来个「即圈即搜」。贵阳市民早高峰拥堵时长缩短了半小时，大模型功不可没。在百...……更多

2024-12-11 09:52:00标王,模型,更多,企业,模态,模型

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展，全球 AI 已经进入到了多模交互时代。2024 年 5 月，OpenAI 推出了全新的多模...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

阶跃星辰李璟：多模态是AGI的必经之路，视觉模型可按语言模型

...璟发表主题演讲《迎接视觉领域的GPT-4时刻》，分享了大模型技术和应用层面的思考。他表示，今年以来大模型厂商密集的模型发布，意味着追求智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要...……更多

2025-05-17 12:05:00模型,按语,模态,之路,必经,星辰

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系，开发出多款大模型平台级产品及AI智能应用类产品，并以全系列AI一体机产品，为大模型应用客户和大型智算中心客户提...……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...步骤，还能根据说明书和工具箱帮你找到合适的工具。2. 强悍的多图复杂推理能力，竟能读懂你的梗！得益于强大的多图复杂推理能力，MiniCPM-V 2.6 不仅能联合识别多张图片的表面信息，还能「读懂」梗图背后的槽点。比如让模...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航，北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩

...利用少量有标签和大量无标签数据视频数据来训练自己的模型，并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能，比如预测情绪类别的准确率。自...……更多

2024-08-01 09:34:00模态,拟人,玩家,模态,情感,模型

llava-1.6与gpt-4vmp面硬刚的性能，一起来看看

...-Plus，与GPT-4V正面硬刚，这个有着SOTA级别性能的多模态大模型真正做到了“人无我有，人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后，2024年1月31日，微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多

2024-02-10 21:04:00性能,模型,模态,训练,数据,卷上

CybotStar——大模型一站式应用开发平台

...的基础层由CPU、GPU、TPU等算力系统组成，为整个体系提供强悍的算力支撑，支撑企业级API高强度的算力调用；中间层内置了机器学习自动部署平台，集成了国内外多个基础型大模型，支持模型全流程高效的训练和部署；上层则是...……更多

2024-08-30 14:57:00应用开发,模型,应用,开发,平台,模型

连发两款模型“补课”，百度AI成色如何？

...杨锦没有发布会、没有李彦宏，百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1，免费。两年前的3月，百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品，也让外界看到百度相对迅速的先手布局...……更多

2025-03-20 11:38:00成色,补课,模型,文心,模型,模态

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型，似乎都很难完成更抽象层...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型（VLM）——PaLI-3，该模型与相似的体...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...点在于，Llama 3.2成为羊驼家族中，首个支持多模态能力的模型。Connect大会上，新出炉的Llama 3.2包含了小型（11B）和中型（90B）两种版本的主要视觉模型。正如Meta所说，这两款模型能够直接替代，相对应的文本模型，而且在图像...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

北京人工智能数据运营平台发布

...工智能研究院理事长、北京大学教授黄铁军表示，构建大模型生态首先要建立数据流通机制，推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集，很难想象人工智能怎样才能实现如此快速的迭代，然而，...……更多

2024-06-16 04:14:00人工智能,北京,人工,运营,智能,数据

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖，论文也是多模态大模型领域的先期工作之一。并且，除了大模型本身，我们提出的针对模型训练的数据集制作流程和整理的数据集，对学术界也具有较...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

多模态大模型是当下很火的一种创新技术，加快对多模态大模型技术的布局，可进一步提高金融服务效率，缓解行业发展困境。为了攻克创新技术领域的难题，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月，我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司，往往只聚焦在...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...EglhJA与此同时，智谱还重磅宣布，该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后，相关能力还将上线视频通话，为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址：https://github.com/THUDM/GLM-4-Voice自...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

What？？？一直低调行事的国内初创公司，旗下模型悄悄地跃升成国内第一、世界第五（仅排在o1系列和Claude 3.5之后）！而且是前十名中的唯一一家国产公司。（该榜上国产第二名是阿里开源的qwen2.5-72b-instruct，总榜第13）。而且...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

page 1/3000 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

丰台怡海中学无人驾驶实训教学项目落地

11月28日，AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学（北校区）举行

2025-12-02 12:04:00

鹭江茶桌仔 | “全球第一”为何相中厦门？

●杨炯上周末，在珠海的亚洲通航展上，奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展，但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌

2025-12-02 08:18:00

博物馆进入“沉浸时代”，感官残障观众如何“入场”

视障文化博物馆“触摸文明”展厅。中青报·中青网记者李怡蒙/摄如今，许多博物馆将视觉、听觉、触觉等多种感知方式融合，创造出多层次

2025-12-02 05:43:00

烟台联通举办客服人员心理健康专题讲座

胶东在线12月1日讯为加强对一线客服员工的人文关怀，帮助员工有效应对工作压力，提升情绪管理与自我调适能力，11月26日

2025-12-02 06:42:00

现代物流网络布局与供应链弹性提升的关联

摘要：本文分析现代物流网络布局与供应链弹性提升的内在关联，探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力

2025-12-02 07:09:00

管理会计在企业战略决策中的应用研究

摘要：本文聚焦管理会计在企业战略决策中的应用，首先解析其与战略决策的内在关联，即通过整合财务与非财务信息，为战略制定提供系统性支持

2025-12-02 07:10:00

警惕境外组织利用恶意SDK收集敏感信息国家安全机关提示

中国网12月2日讯据国家安全部官微消息，国家安全部提示，SDK（软件开发工具包）是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合

2025-12-02 07:26:00

全球首创全动压空气轴承产业化成果发布，开启高端制造新纪元

北京讯—— 2025年11月28日，“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破

2025-12-02 07:32:00

联通超清电视狂欢双十一，临沂IPTV用户喜获iPhone17

鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官，在这场全民消费热潮中，山东联通精心策划的“双十一福利再升级”活动脱颖而出

2025-12-01 11:12:00

千里运荔藏巧思现代加盟终端拓新局

“就算失败，我也想知道，自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词，精准道出了当下创业者选择加盟之路时的执着与忐忑

2025-12-01 12:23:00

赛事总奖金160万元！WCI国际冠军赛苏州完美收官

2025年坦克世界国际冠军赛（WCI）11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐

2025-12-01 13:58:00

2025年北京市中小学生电子与信息创意实践活动圆满举行

当AI小球听懂指令，当智能车驰骋赛场，当电路在指尖点亮创意……孩子们像科学家一样思考，像工程师一样实践。11月30日，2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕

2025-12-01 14:26:00

烟台联通创新应用高压直流供电技术破解高铁5G基站供电瓶颈

胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中，烟台联通成功应用高压直流供电技术创新方案，有效解决了牟平北山隧道西口

2025-12-02 05:00:00

海尔智慧家庭成立创新实验室布局好房子住居生态

海尔智慧家庭战略持续强化、开放和加速布局，又交出新成果。11 月 28日，以“AI 新纪元共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开

2025-12-01 14:51:00

海尔智慧家庭新成果：2025物联网大会斩获两项大奖

海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局，如今再添重磅新成果。11 月 29 日，在首届全球万物智联数字经济可持续发展大会暨2025（第十届）世界物联网大会上

2025-12-01 14:51:00

头条订阅服务