模态,宝宝,模型,图像,训练,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...息处理全国重点实验室两大平台，长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士，研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真，研究方向为...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

AIGC工具测评：生成式AI的产品表现如何

...力上也有了重大突破。更值得一提的是，GPT-4引入了“多模态”功能，支持图像和语音输入，甚至可以输出图片，大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格，其简洁的设计语言和优化的...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

度小满联合哈工大推出自适应剪枝算法实现多模态大模型高效优化

多模态大模型是当下很火的一种创新技术，加快对多模态大模型技术的布局，可进一步提高金融服务效率，缓解行业发展困境。为了攻克创新技术领域的难题，度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多

2024-05-17 13:00:00模态,算法,模型,联合,模态,模型

李未可科技正式推出WAKE-AI多模态AI大模型

...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互，同时多模态问答技术的加...……更多

2024-04-19 14:30:00模态,模型,科技,模态,模型,场景

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

...，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V，声称只花500美元训练，就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现，该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

不够惊艳？还是更务实？谷歌对上OpenAI，能否打好翻身..

...项目Project Astra、对标Sora的文生视频模型Veo，以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元（TPU）Trillium芯片等等。其中，Astra是谷歌的AI智能体项目，能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容，响...……更多

2024-05-15 18:31:00不够,还是,生成,模型,文生,图像

阿维塔07 Ultra版将在10月下旬开始生产

...车型形成竞争关系。近日，苹果公司推出了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，...……更多

2024-10-15 02:11:00阿维,生产,阿维,模型,别为,苹果公司

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...混元API服务调用，可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初，腾讯混元就宣布在国内率先采用MoE架构模型，总体性能比上一代密集模型提升50%。此后，腾讯混...……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

“世界模拟器”的文化偏见与AIGC时代的文化竞争

...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力，确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多

2024-04-10 10:41:00文化,模拟器,偏见,竞争,时代,世界

Sam Altman或筹数十亿美元自造AI芯片，DeepMi

...期版本，并接近最新版本的表现。此外，GLM-4还增强了多模态能力，其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store，为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多

2024-01-29 09:20:00首席,科学家,芯片,创业,科学,模型

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到，Step模型是一个系列，而Step-2是其语言模型的实力代表。在这个系列中，除了语言模型，阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

AI应用正面临能耗挑战？分布式算力提供新路径！

...术为医疗诊断、安全监控和娱乐行业提供了强大支持。多模态AI：使AI能够同时处理和理解来自不同来源的信息，如文本、图像、声音和视频等，多模态AI的发展使得机器能够感知、理解甚至预测需求，提供更加个性化和智能化的...……更多

2024-10-29 17:30:00分布式,能耗,路径,应用,模型,分布式

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列

...规模高达2100亿，覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同，他们解码的是生命语言，而非自然语言，意味着不仅能处理复杂的生物序列...……更多

2024-11-07 09:50:00模型,重构,生命科学,序列,生命,基础

英国ai初创公司wayve公布gaia-1最新进展

...驶车辆的行为和场景特征进行细致的控制，且由于GAIA-1多模态的性质，能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到，GAIA-1可对环境进行学习，从而提供结构性的环境理解，协助自动驾驶系统做出明智的决策...……更多

2023-10-10 11:51:00英国,进展,公司,模型,驾驶,生成

$多个中国团队斩获EMNLP\\\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者

...化再创作任务。鉴于多媒体内容兴起，翻译需涵盖图像等模态，传统翻译局限于处理语音和文本中的语言，跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道：e2e-instruct 直接编辑图像，cap-edit 通过字幕和 LLM 编辑...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

在最近一项研究中，DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向，背后有着多重考量。最初，该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...千亿量级的高质量图像。此外，团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后，想要更好地发挥出模型的实力，还需...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...先的数据闭环能力，并创新构建了离线点云大模型，为跨模态的数据标注、数据挖掘和模型训练提供强大支持，大幅提高数据价值和利用效率，提升长尾场景处理能力。在数据标注方面，轻舟智航可实现2D图像和3D图像的自动化...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

Sora“超级涌现力”将把AI引向何方

...tokens（机器模型输入的基本单位），而谷歌最近发布的多模态通用模型Gemini 1.5 Pro就把稳定处理上下文的上限扩大至100万个tokens。Sora之所以能对物理世界规律进行模拟，一个可能的原因在于大数据驱动下，人工智能模型体现出一...……更多

2024-02-24 05:43:00何方,模型,单词,视频,人工智能,人工

谷歌大模型Gemini视频被质疑造假、夸大宣传，官方回应：演

...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而，有多个消息称，这段制作的演示视频夸大了Gemini技术能力，被质疑造假、夸大宣传等，实际上手时发现Gemini并不能达到视频中的效果。同时，这类营...……更多

2023-12-08 22:02:00剪辑,演示,模型,宣传,焦点,媒体

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

我市发布首批行业高质量数据集

...12个重点领域，类型包含文本、图片、音频、视频等多种模态。其中，中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多

2024-06-21 05:16:00高质量,数据,行业,数据,模型,海河

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

语音能力再突破！讯飞星火语音大模型即将发布

...代码纠错、代码解释、单元测试生成5个维度升级，其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日，在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上，星火认知大模型V3.0...……更多

2024-01-29 15:57:00音大,讯飞,星火,语音,模型,突破

只用 13 天，OpenAI 做出了能听、能说、能自主决策的

...的文本转录到由 OpenAI 训练的，可以理解图像和文本的多模态模型（VLM）中，由该模型处理对话的整个历史记录，得出语言响应，然后通过文本到语音的方式将其回复给人类。同样的模型，也负责决定在机器人上运行哪些学习...……更多

2024-03-14 19:00:00模型,决策,机器,机器人,机器,模型

拓宽行业应用场景多模态大模型加速通用AI进程

...业内分析认为，该项新产品或将促使大模型厂商加大对多模态大模型的研发投入，并进一步推动AGI（通用人工智能）进程。一直以来，视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后，Sora的发布迎合了...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

...，使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入（M-ROPE）方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息，M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

page 3/1000 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

海外媒体发稿：品牌出海的“流量密码”

出海浪潮中的品牌挑战在经济全球化的大背景下，品牌出海已然成为众多企业寻求突破与发展的重要战略选择。越来越多的中国品牌将目光投向海外

2025-03-11 23:37:00

谋划“十五五”数字化转型关键行动广药集团与华为签署全面战略

2025年3月10日，广州医药集团有限公司（以下简称“广药集团”）与华为技术有限公司（以下简称“华为”）在华为东莞松山湖基地签署全面战略合作协议

2025-03-11 23:41:00

雷诺CEO：欧洲汽车业应向中国学习避免彻底落后

快科技3月11日消息，据新华社报道，法国《法兰西西部报》近日发表题为《雷诺集团负责人卢卡·德·梅奥：“中国人教会了我们什么”》的文章

2025-03-11 23:49:00

经济大省挑大梁丨千方百计开拓市场外贸企业抱团出海抢单忙

今天，韩国国际模具及相关产业展在首尔举行，黄岩十多家模具企业首次组团参展，不少企业都带来了各类汽车模具、精密电子模具等最新产品

2025-03-12 00:04:00

丰田、日产们终于想通了开始搞国产车换壳了

在国内市场被暴揍了这么多年以后，合资的车企们好像终于想明白了。就在最近这一两个星期，咱们很熟悉的日系御三家：丰田、日产和本田纷纷在国内发布了自家的纯电动新车

2025-03-12 00:19:00

《白雪公主》真人电影新片段和海报：皇后送公主毒苹果

近日迪士尼真人电影《白雪公主》新片段，以及杜比和IMAX版等新海报发布，片段展示了白雪公主与皇后的谈话。海报则展示了皇后送白雪公主毒苹果的场景

2025-03-12 00:19:00

稚晖君和机器人离不开自行车

2021 年 6 月，稚晖君在 B 站上发布了一条「自动驾驶自行车」的视频，一经推出迅速火爆，也让他后来成为人们口中的「华为天才少年」

2025-03-12 00:19:00

小米15 Ultra首销量翻倍！6000-8000价位第一

快科技3月12日消息，小米15 Ultra在3月3日正式首销，一周时间过去，有第三方机构的数据显示，该机首周销量对比前代直接翻倍

2025-03-12 00:19:00

这些平顶山就像天空之岛！是失落的世界到处是食肉植物

在南美洲北部国家委内瑞拉雨林的深处，有一些神秘的山脉，这些山脉是完全平顶的，而周围由几乎完全垂直悬崖构成，整座山就像一块凸起的桌子一样

2025-03-12 00:19:00

中国首个商业中型可回收火箭！蓝箭航天星云一号整机试车圆满成功

快科技3月11日消息，2025年2月22日，深蓝航天自主研发的星云一号火箭配套二子级液氧煤油真空发动机“雷霆RV”进行了第二轮整机试车

2025-03-12 00:49:00

第20万台小米SU7将在本周下线工厂订单已排到明年

有数据分析师表示，截止2025年3月9日，小米汽车已经累计交付19.1万辆汽车，预计第20万辆小米SU7将在本周下线，下周正式交付给用户

2025-03-12 00:49:00

有了“长毛猛犸鼠” 我们真的能“复活猛犸象”吗

美国生物技术公司 Colossal Biosciences 在 3 月 4 日宣布，他们创造出了一批“长毛猛犸鼠”，称这是复活猛犸象的第一步

2025-03-12 01:19:00

龙芯CPU打造纯国产税务系统：中国银联都用它！

快科技3月12日消息，龙芯中科介绍了基于龙芯CPU处理器的纯国产税务系统信创方案，既满足了信创改造需求，也实现了税务系统的智能化升级

2025-03-12 01:49:00

自助+AI，台球经济的科技“加持”

本文转自：人民日报海外版夜幕降临，华灯初上，城市中大大小小的台球厅开始热闹起来。明亮的灯光下，一张张台球桌整齐排列，球杆碰撞声

2025-03-12 03:49:00

与AI同游，不能少了有温度的服务（览胜观潮）

本文转自：人民日报海外版厉新建杨占东在“AI+旅游”的发展过程中，我们要更多思考如何建立人与AI良好协作的新模式，AI的“聪明才智”必不可少

2025-03-12 03:50:00

头条订阅服务