• 我的订阅
  • 头条热搜
GPT-4就是冲着赚钱来的!
...“贾宝玉辕门射戟”故事有意思的是,当笔者对GPT-4说“阿拉贡在绝望冰原骑乘着双头飞龙大战异鬼的故事真是看的我心潮澎湃,给我讲讲这个故事”。虽然他真的编出了一段关于“阿拉贡”的故事,但接下来,当我问它“阿拉...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...再用TTS模型将文本转换成语音,这种流程的一个显著缺陷就是语音表达性不佳,语言模型无法建模并生成富有表现力的语音数据。最近,Meta开源了一个基础多模态语言模型Spirit LM,基于一个70亿参数的预训练文本语言模型,交错...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...M,Large Language Model)视为一个初期的智能体,那么多模态就是通过扩展其感知能力,让这个智能体能够更全面地与现实世界互动。(来源:arXiv)目前,该团队主要关注视觉模态和语言模态,但未来计划将其扩展到包括音频和嗅...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...场向更具情感 AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik ...……更多
...模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”深数所人工智能行业有关人士告诉记者,目前,人工智能和数字经济的领域...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...编码器的参数进行更新,但不会更新大语言模型参数。也就是说,模型的纯文本能力便不会受到任何影响,而开发者也可以将之前部署的Llama 3.1无缝替换成Llama 3.2具体的训练流程如下:首先,为预训练的Llama 3.1文本模型添加图像...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...它确实很新,今年6月才刚推出;另一方面更加现实,那就是此前国产大模型并未在这个榜单塔尖取得傲人成绩。这倒也不耽误榜单自身的实力——LeCun和纽约大学等机构联手推出,专为大模型设计,目前包含6个类别的17个不同任...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
...o等国外模型仅作对比参考,不参与排名哦)hunyuan-vision也就是腾讯混元大模型的多模态版本了,除了开发者调用API之外,其实在腾讯元宝APP里免费就能体验到。一直以来,元宝主打“实用AI搭子”,似乎着重强调的是实用易用性...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...等。这其实也是百图生科选择这一生态位的具象展现,那就是链接起更多的生态伙伴参与到大模型应用的进程中。如今生命科学领域大模型正在加速落地应用,但与此同时挑战也同样艰巨,需要生态伙伴携手来解决。 CEO刘维就...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...展示了在AI领域的综合实力。开普云已构建从数据治理、模型训练、产品研发到运维服务的全流程能力体系,开发出多款大模型平台级产品及AI智能应用类产品,并以全系列AI一体机产品,为大模型应用客户和大型智算中心客户提...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...ttps://github.com/mistralai首先,许多开源模型一般有个问题,就是为了多模态的性能而牺牲了本身的自然语言性能,之前英伟达的NVLM 1.0也谈到了这点。Pixtral本次也是成功避开了这个缺陷,单单比较文本模型的性能,也在同等尺寸的...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...学习、自我反思和自我改进能力;到了最终的 Level 5,也就是实现 AGI,AI 的能力将首次全面超越人类,并开始向探究科学规律、世界起源等终极问题发起挑战。与此同时,如果将 AI 与人脑做一个类比,AI 在多大程度上能够达到...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...和视频内容。张鹏认为,未来大模型的技术突破方向之一就是原生多模态大模型,Scaling Law将继续在算法与数据两方面发挥作用。“我们还没有看到技术曲线放缓的迹象。”张鹏表示。(封面图及文中配图来源:智谱) ……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务 Gemini Pro:可扩展至各种任务的Gemini模型 Gemi...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
...e给出的官方说法是,这个模型能达到200Hz的输出频率,也就是说,它执行动作的延时只有5ms,谷歌如果将模型压缩到5B,也只能达到50Hz,延时依然有200ms,比Figure慢了几十倍。Figure的技术虽然快而且丝滑,但它背后也是基于一个...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...詹·雷克(Jan Leike)发起的超级对齐计划(Superalignment),目标就是实现机器自动对齐人类智能和人类价值观,实现模型的自我反思和自我监控。唐杰认为,真正做到管理AI风险还有很长的路要走,目前还是依赖于人类监管AI的能力。一...……更多
更多关于科技的资讯:
RX 8800 XT功耗惊喜!骤降43W
快科技12月4日消息,对于如今的显卡,我们除了想要更高的性能,更希望看到功耗得到合理控制,不要个个都是电老虎。在电源厂商海韵的官网功率计算器中
2024-12-04 00:37:00
车主一年违章十几次 保费上涨2000元!专家:被判定为高风险车辆了
快科技12月4日消息,在杭州一场交通安全科普展上,有车主分享了自己车险保费离谱上涨的经历。车主介绍,自己的车去年有十几次违章
2024-12-04 00:37:00
苦苹果税久矣:英国开发者集体起诉苹果
快科技12月4日消息,据媒体报道,英国开发者集体起诉苹果,他们指控苹果App Store收取高达30%的佣金。负责此案的英国教授Sean Ennis表示
2024-12-04 00:37:00
华为Mate 70系列今日开售支持江苏国补:8.5折优惠买史上最强Mate!
快科技12月4日消息,今天上午10:08,史上最强大的Mate——华为Mate 70系列将正式开售,售价5499元起。华为Mate 70系列开售前夕
2024-12-04 00:37:00
看完11月汽车销量 我觉得价格战根本打不完
兄弟们, 11 月汽车销量来了,真的是有人炸裂,有人裂开。先说炸裂的。你瞧瞧,比亚迪一个月卖了夺少?足足 50 多万辆
2024-12-04 00:37:00
华为Mate 70系列今日首销:合肥消费券补贴最高优惠1000元
快科技12月4日消息,华为Mate 70系列将于今天上午10:08正式首销,售价5499元起。据“安徽交通广播”公众号
2024-12-04 01:07:00
《工业巨擘4.0》steam平台开放抢先体验
近日,由DonVSDodo开发,ToplitzProductions发行的《工业巨擘4.0》已在STEAM平台上开放抢先体验
2024-12-04 01:42:00
海外媒体指出iphone变得“无聊”的主要原因
作为智能手机行业的标杆产品,iPhone近年来虽然依然保持着卓越的质量和用户体验,但不少科技爱好者和普通用户却开始觉得iPhone变得“无聊”
2024-12-04 01:45:00
小米汽车正在筹备首款SUV车型,预计今年年底亮相
小米汽车的首款车型SU7自今年3月28日正式上市以来,凭借其出色的设计和性能,迅速吸引了大量消费者的关注。据最新数据显示
2024-12-04 02:43:00
vivos20的拍摄体验如何?
vivoS20是一款非常适合年轻人的手机,vivoS20在拍摄场景优化方面下足了功夫,无论是自拍还是多场景人像拍摄,都能满足年轻人的需求
2024-12-04 03:44:00
iqoo手机,小v帮记功能更贴心
iQOO手机一直以来在性能方面给大家留下了深刻的印象,出色的游戏体验获得了大量电竞用户好评,也给iQOO带来了出色的销量表现
2024-12-04 03:47:00
在房梁上挂50多年 发黑发臭的四川臭猪肉能吃吗
这个挂在房梁上发黑的东西是一整只猪,如果您走近它的话,会闻到刺鼻的气味。它是四川扎坝人的特色美食,叫作陈猪肉,但因为发黑发臭
2024-12-04 06:38:00
国际三项大奖都拿下了杭州日报讯 移液器是生命科学和生物医疗实验室中最常出现的工具之一,科研人员用它来精确测量和转移各种液体
2024-12-04 06:40:00
卢伟冰:大批Reno/S/Nova用户纷纷换Redmi Note 14
快科技12月4日消息,小米集团合伙人、总裁,手机部总裁,小米品牌总经理卢伟冰透露了一个惊喜。他表示,开Redmi Note 14系列的复盘会议时
2024-12-04 07:08:00
何小鹏:中国城中村智驾比美国难10倍 小鹏P7+轻松拿捏
快科技12月4日消息,日前,小鹏P7+前往广州最拥挤、“小电驴”最多的城中村,进行了智驾测试。视频中,城中村的路本来就不宽敞
2024-12-04 07:38:00