• 我的订阅
  • 头条热搜
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...萨比斯在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...性创新的今天,OpenAI公司隆重宣布,其最新研发的GPT-4o多模态模型正式问世。这款全新的人工智能模型不仅继承了GPT-4的卓越性能,更在实时对话、图文分析等方面实现了质的飞跃,被誉为钢铁侠中全能AI管家贾维斯的现实版。GP...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
AIGC工具测评:生成式AI的产品表现如何
...力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的用户界面呈现了现代化和直观的设计风格,其简洁的设计语言和优化的...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...项目Project Astra、对标Sora的文生视频模型Veo,以及支持多模态输入的AI搜索引擎和第六代Tensor处理器单元(TPU)Trillium芯片等等。其中,Astra是谷歌的AI智能体项目,能够通过手机摄像头或智能眼镜来“看到”用户眼前的内容,响...……更多
阿维塔07 Ultra版将在10月下旬开始生产
...车型形成竞争关系。近日,苹果公司推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...混元API服务调用,可满足文生文、图生文、文生图等不同模态以及角色扮演、FunctionCall、代码等不同专项的模型需求。2024年年初,腾讯混元就宣布在国内率先采用MoE架构模型,总体性能比上一代密集模型提升50%。此后,腾讯混...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在多项评测维度上达到了DALL·E3的90%以上水平。智谱AI还发布了GLMs和GLM Store,为用户提供定制化的个人GLM大模型和模型应用商店。GLMs降低了大模型...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
AI应用正面临能耗挑战?分布式算力提供新路径!
...术为医疗诊断、安全监控和娱乐行业提供了强大支持。多模态AI:使AI能够同时处理和理解来自不同来源的信息,如文本、图像、声音和视频等,多模态AI的发展使得机器能够感知、理解甚至预测需求,提供更加个性化和智能化的...……更多
英国ai初创公司wayve公布gaia-1最新进展
...驶车辆的行为和场景特征进行细致的控制,且由于GAIA-1多模态的性质,能够从多种提示模式和组合中生成相关视频。▲图源Wayve官方提到,GAIA-1可对环境进行学习,从而提供结构性的环境理解,协助自动驾驶系统做出明智的决策...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...化再创作任务。鉴于多媒体内容兴起,翻译需涵盖图像等模态,传统翻译局限于处理语音和文本中的语言,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
AI出图更快、更懂你心意,高美感文生图模型修炼了哪些技术秘籍?
...千亿量级的高质量图像。此外,团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后,想要更好地发挥出模型的实力,还需...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...先的数据闭环能力,并创新构建了离线点云大模型,为跨模态的数据标注、数据挖掘和模型训练提供强大支持,大幅提高数据价值和利用效率,提升长尾场景处理能力。在数据标注方面,轻舟智航可实现2D图像和3D图像的自动化...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
Sora“超级涌现力”将把AI引向何方
...tokens(机器模型输入的基本单位),而谷歌最近发布的多模态通用模型Gemini 1.5 Pro就把稳定处理上下文的上限扩大至100万个tokens。Sora之所以能对物理世界规律进行模拟,一个可能的原因在于大数据驱动下,人工智能模型体现出一...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
...12个重点领域,类型包含文本、图片、音频、视频等多种模态。其中,中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上,星火认知大模型V3.0...……更多
...业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了...……更多
更多关于科技的资讯:
网友票选年度最佳手机:iPhone罕见跌出Top 4!
快科技12月22日消息,在Android Authority近期的年度最佳手机票选中,三星Galaxy S24 Ultra经过两轮激烈竞争后脱颖而出
2024-12-22 14:02:00
鸿蒙智行泊车代驾VPD正式开启全量推送!升级自动泊车/接驾等多项功能
快科技12月22日消息,鸿蒙智行近日宣布全面推送泊车代驾VPD功能,该功能基于华为ADS 3.0技术,带来了多项创新。据悉
2024-12-22 14:02:00
全球第三大车企要诞生了 本田与日产明天启动合并磋商
快科技12月22日消息,据报道,本田和日产汽车23日起将正式启动经营合并磋商,三菱汽车则在协调于明年年初决定是否参与合并
2024-12-22 14:32:00
威刚XPG动境机箱首发199元:独特洞洞板设计
快科技12月22日消息,威刚推出了XPG动境机箱,该机箱以经典的黑、白两色呈现,预售价299元,而首发期间199元。XPG动境机箱的最大亮点
2024-12-22 14:32:00
三星没放弃曲面屏开发!最新专利曝光暗示有望回归
快科技12月22日消息,近年来曲面屏在Android市场中逐渐失宠,三星作为曲面屏幕手机的先驱,连自家旗舰S24 Ultra也放弃了曲面设计
2024-12-22 14:32:00
不许说日语的App在日本爆火:必须用“伪中国语”聊天 日本人和中国人都能看懂
快科技12月22日消息,近日,“伪中国语”在日本网络上翻红。一款名为“对多”(推特的谐音)的App在12月18日更新上线后
2024-12-22 14:32:00
李斌回应蔚来ET9定价78.8万起:很合理 有朋友说不要低于80万
快科技12月22日消息,在媒体沟通会上,蔚来创始人、董事长李斌回应了蔚来新旗舰车型ET9的定价逻辑。他表示,市场定价本身也是一种定位
2024-12-22 15:02:00
最新研究!AI污染可导致美国60万人得哮喘 1300名患者早亡
快科技12月22日消息,据某学术平台报道,近日,一项重要研究发现,至2030年,支持人工智能(AI)所需的电力可能会给美国带来严重的公共卫生问题
2024-12-22 15:02:00
60度电池跑出100度续航!特斯拉电耗水平全球第一 雷军承认小米需要3-5年学习
快科技12月22日消息,特斯拉公司副总裁陶琳今日发文称,特斯拉车型能耗表现出众,可以用60度跑出100度电池的效果。她强调
2024-12-22 15:32:00
限时13.59万起!领克纯电紧凑型SUV——Z20正式上市
快科技12月22日消息,领克Z20,基于SEA浩瀚架构打造的纯电紧凑型SUV正式上市。据悉,共推出三款车型,官方指导价区间为13
2024-12-22 15:32:00
雷军周末开小米SU7 Ultra跑山:戴墨镜、穿风衣 网友直呼太帅
快科技12月22日消息,今日雷军在微博晒出一组和小米SU7 Ultra的合影。照片中,雷军戴墨镜、穿风衣,站在小米SU7 Ultra车前
2024-12-22 16:02:00
《森林》迎来历史新低,steam国区原价70元
12月20日消息,多人联机生存游戏《森林(TheForest)》昨日迎来了新的历史最低价,Steam国区原价70元,立减90%后售价7
2024-12-22 16:58:00
全球覆盖规模最广!高德地图携手蔚来发布全域车道级导航:ET9首搭
快科技12月22日消息,高德地图与蔚来汽车合作,在蔚来NIO DAY上宣布推出全域车道级导航服务,首发搭载于蔚来ET9车型
2024-12-22 17:02:00
奇瑞旗下星途星纪元公布OS 1.4.0版本OTA内容
12月20日消息,奇瑞旗下星途星纪元今日公布OS1.4.0版本OTA内容,80+项新增与优化功能,近期OTA陆续推送中
2024-12-22 17:04:00
飞牛私有云发布fd5硬盘柜,5盘位设计
12月20日消息,飞牛私有云今日发布了FD5硬盘柜,定价850元。官方表示,这款硬盘柜主要为装有飞牛系统的小主机NAS用户设计
2024-12-22 17:08:00