• 我的订阅
  • 头条热搜
...工智能研究院理事长、北京大学教授黄铁军表示,构建大模型生态首先要建立数据流通机制,推动从数据到智能的正反馈。汇聚数据超700万亿字节“如果没有开源数据集,很难想象人工智能怎样才能实现如此快速的迭代,然而,...……更多
支付宝多模态医疗大模型正式亮相
在2024世界人工智能大会“可信大模型论坛”上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据CNMO了解,支付宝医疗大模型的基座模型为蚂蚁百灵大模型。据蚂蚁集团大模型应用部总经理顾进杰介...……更多
算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型...……更多
中文大模型最新评测出炉:腾讯混元国内第一!
快科技8月5日消息,在最新发布的中文多模态大模型SuperCLUE-V基准评测中,腾讯混元大模型获国内排名第一,稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力,即多模态理解,俗称“图生文”。多模态...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
机器之心报道机器之心编辑部近日,云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻...……更多
文博会观察:大模型为文化产业发展提供新机遇
...现实的文旅知识库,为“李白”提供“智慧大脑”,化身全能的旅行智能导游……“在没有大模型之前,‘数字人’并没有‘智慧’的大脑。目前已经有了‘聪明’的数字人,背后的‘大脑’运转模式与人类相似,他们可以根据...……更多
“不要卷模型,要卷应用!”李彦宏谈AI:大模型公司热衷于写高考作文,价值不大
...。百度创始人、董事长兼首席执行官李彦宏再次强调闭源模型的优势,称激烈竞争环境下,商业化闭源模型最能打。另外,没有应用,基础模型一文不值。李彦宏还表示,要避免掉入“超级应用陷阱”,随着基础模型的日益强大...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
vivo蓝心大模型升级为“自研ai多模态大模型”
...销月的销量是上一代的432%。同时黄韬宣布,vivo的蓝心大模型升级为“自研AI多模态大模型”,这项技术通过视觉、声音、空间等多维度感知和理解世界,使大模型变得更加全面、智能和强大。蓝心大模型的使命是确保科技革命...……更多
本文转自:株洲日报OpenAI震撼发布GPT-4o——打造全能AI助理 将向用户免费提供北京时间5月14日凌晨,OpenAI发布会公布了新的模型迭代版本GPT-4o,其中“o”代表omnimodel(全能模型)。Sam Altman在社交媒体X上发布推文称,GPT-4o是原...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...挺有趣:生成式AI让世界有了一个统一的语言——Token。AI模型可以通过对物理世界数据的Token化,理解真实世界的方方面面。理解之后,AI就可以模仿人类去执行物理世界的任务,这将带来新的产业革命。 接下来,我们试图就这...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位...……更多
...18日电 (记者 曾焱) 世界卫生组织18日发布的多模态大模型治理相关新指南说,人工智能在医疗卫生领域应用前景广阔,但同时也要防范其中可能出现的诸如“自动化偏见”导致的过度依赖等风险。作为一项快速发展的生成式...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
“同行们认为我们用大模型把音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
作者:赖文昕编辑:陈彩娴2024 年已经过半,大模型技术的角逐也逐渐从上半场的「百模大战」转向下半场聚焦落地「千行百业」的产业应用。过去短短 2 个月以来,全球 AI 界接连开展了数十场发布会,从海外的英伟达、OpenAI...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...作研究,构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
多模态AI午前大涨,游戏ETF半日涨幅近4%
...整个ETF市场。投资逻辑方面,日前,谷歌发布了基础世界模型Genie,Genie是一个110亿参数的基础世界模型,可以通过单张图像提示生成可玩的交互式环境。只需一张图像就能创建全新的交互环境的AI技术,为生成和进入虚拟世界的...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和时间对齐、多分辨率因果Q-Former、多样性损失函数和混合未配对音视频数据训练。该模型不仅...……更多
不够惊艳?还是更务实?谷歌对上OpenAI,能否打好翻身...
...刚抢过风头,推出了最新多模态大模型GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出,可实现人类级别响应。从已有的演示视频来看,谷歌AI助手的回应速度似乎比G...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
现在,长上下文视觉语言模型(VLM)有了新的全栈解决方案 ——LongVILA,它集系统、模型训练与数据集开发于一体。现阶段,将模型的多模态理解与长上下文能力相结合是非常重要的,支持更多模态的基础模型可以接受更灵活...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...动过程中不断促进自身“进化”。传统 AI 需要依靠内置模型对世界进行表征,再根据这些表征建构行为概念,这种模式高度依赖人工数据标注,不仅缺乏应对多变情况的灵活性,也无法理解与任务相关的未标注因素。由于传统 A...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...正好印证了这个论断。但Gemini的发布惊艳世人,改变了大模型领域ChatGPT独领风骚的局面。Gemini 不仅在很多性能上超过了ChatGPT 4,它同时带来了另一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...作为智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
GPT革命:王小川向左,Sam Altman向右|钛媒体焦点
...而是大模型、超级应用、产研协同、生态创新都具备的“全能冠军”。作为最接近 OpenAI 技术能力的商业大咖,王小川正在开启二次创业旅程,而且所有人都希望中国能够跑出一家像OpenAI一样的公司,衷心祝王小川这轮创业成功...……更多
更多关于科技的资讯:
男子闯红灯险撞人 竟发微信群炫耀 群友:我举报了
快科技9月27日消息,近日,浙江交警发文称,宁波交警接到热心网友举报,称有人在微信群中炫耀自己闯红灯的行为,甚至表示“差点就撞到人了
2024-09-28 00:02:00
intel第二代独立battlemage系列显卡规格曝光
9月27日消息,近日,有关Intel第二代独立Battlemage系列显卡的详细规格在网上曝光,引发了业界和消费者的广泛关注
2024-09-28 00:02:00
“一加旗舰新品”geekbench跑分曝光
9月27日,一加中国区总裁李杰公布了一款“一加旗舰新品”的Geekbench性能跑分数据。按照一加产品阵容及新机发布节奏
2024-09-28 00:02:00
坎儿井:这种3000年前的水利工程 至今还在用
下面这个是坎儿井,从空中俯瞰,一个个井口连接成线,非常壮观。它是世界上为数不多,存在超过2000年,却依然还在执行它最初功能的工程
2024-09-28 00:02:00
《星际争霸》射击游戏开发者悄然进行第三次探索
9月27日消息,暴雪娱乐公司,这个曾经的游戏界巨头,如今再次挑战自我,试图在《星际争霸》这一经典IP上开辟新的射击游戏篇章
2024-09-28 00:17:00
哪吒海外市场再下一城!首批哪吒X于印尼正式上市交付
快科技9月27日消息,哪吒汽车近日在印尼雅加达举行了其纯电智能中型SUV——哪吒X的上市仪式,并宣布将向首批500位车主交付新车
2024-09-28 00:32:00
Redmi Note系列坚持做红外:曾经砍过被骂回来了 再也不敢砍了
快科技9月28日消息,Redmi Note 14系列发布之后,官方也按照小米汽车之前的方式,发布了一期网友问答,其中解答了不少问题
2024-09-28 00:32:00
agon爱攻发布全新高性能电竞显示器,价格降至冰点
在今年早些时候,AGON爱攻发布了全新高性能电竞显示器,AGONAG246FK其作为AGON爱攻面向进阶玩家以及职业选手的高端电竞设备
2024-09-28 00:41:00
iqooz9turbo+性能表现
今年九月,华为与苹果相继推出新品,宛如神仙打架般精彩绝伦。想必大家对于旗舰手机已然有些审美疲劳。而就在月底,iQOOZ9Turbo+登场
2024-09-28 00:49:00
小米14T系列10月10日正式亮相
近日,小米日本公司宣布将于10月10日星期四举行一场产品发布会。该公告回顾了小米14Ultra的发布,称这款手机彻底改变了智能手机摄影的游戏规则
2024-09-28 00:56:00
高通骁龙8gen4移动平台旗舰机型配置曝光
9月27日,知名爆料人士数码闲聊站放出了一款SM8750(高通骁龙8Gen4移动平台)旗舰机型的后置影像系统配置。综合其它信息
2024-09-28 01:01:00
奥迪中国总裁罗英瀚:奥迪产品将全面换代
9月27日消息,奥迪中国总裁罗英瀚在近日举行的战略媒体沟通会上宣布,未来24个月内,奥迪产品将全面换代,以更好地适应中国市场的变化和消费者需求
2024-09-28 01:20:00
苏州瑞芯智能科技有限公司成立
9月27日消息,近日,一家名为苏州瑞芯智能科技有限公司的新兴企业在业界引起关注。据企查查APP披露的信息,该公司由张建明担任法定代表人
2024-09-28 01:41:00
万得厨厨房智能体,让向往的烹饪方式触手可及
美食家称,汤是广东饮食文化的底蕴,也是广东人生活里最日常的幸福。如果问一个广东人,哪家的汤最好喝,答案多半是“妈妈煲的汤”
2024-09-28 01:42:00
redminote14系列引爆市场热情
9月27日消息,小米旗下子品牌Redmi近日盛大推出了全新Note14系列手机,起售价亲民定为1099元。新机一经发布便迅速开售
2024-09-28 01:43:00