• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
...市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献) ……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
大模型“遍地”都是,谁能真正解放生产力?
...市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...aS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...对这一领域关注得很早,有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”,当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多
萤石推出智能家居AI主机!接入自研蓝海大模型,智能手表抬手就能看血糖
...融合难,而且单一产品往往没法解决场景系统问题,所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架,云端大模型为复杂场景问题提供了解法,一些简单问题则由本地小模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...多模态模型」实现了规模与模态的双重突破。在规模上,团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据,创新「跨模动态对齐」技术,融合大语言模型,实现千亿参数视觉语言模型。在模态上,团队建设模态动...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...、Relay Diffusion(ICLR’24)、CogView3 (2024)。基于CogView,团队研发基于大模型的文本到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视...……更多
Sora爆火96小时国内大模型进场
... 查睿春节期间,大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界极大的震撼,网友惊呼“现实不存在了”。发布短短96个小时内,国内已...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
近日,2024世界人工智能大会(WAIC 2024)期间,中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al,智能体重新定义世界”自主智能+创新应用论坛,该论坛是本次世界人工智能大会核心专业论坛...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。若愚科技是一支源自哈工大的团队,创立于2023年,旨在通过多模态大模型技术打造机器人大脑。公司创始人聂礼强现任哈尔滨工业大学(深圳)计算机...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。多模态的意义在于,为AI应用带来更多的可能性...……更多
...24日 第 09 版)本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...更懂中国用户。在语言模型客观评测中,OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。多模态理解模型客观评测结果显示,图文问答方面,阿里巴巴...……更多
不要小看「实而不华」的腾讯 AI
...纲等新功能,大大提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了 38%...……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...资源与AI行业的数据需求通道打通,我们成立了Coohom Cloud团队,这是团队专门面向前沿科学领域,以高性能渲染和数据加工能力,将群核科技的数字矿山提炼为AI行业所需要的各种数字燃料,包括视频集,3D数据集等。大家可以看...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...”背后过去一年,百模大战如火如荼,国内外不少大模型团队热衷于跑分与对标。李彦宏则在多个公开场合向行业呼吁应用的重要性,称“要卷AI原生应用,不要卷大模型”。在不久前的一次访谈中,李彦宏在回应什么是百度战...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...储备,做好前瞻技术布局,横向扩展AI使用场景。4、初创团队引领下游硬件多点开花,重量级硬件应用涌现可期“人工智能技术+互联网平台”给传统行业带去创新动力,AI下流应用层出不穷,未来有可能出现颠覆性的应用。我们...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
... 30 个测试集的性能超过当前 SOTA 结果。 Gemini是谷歌各个团队大规模合作的成果,包括谷歌研究院的研究者,这个模型从发布之初就定位为原生多模态结构,这意味着它能够跨越文本、图像、视频、音频和代码进行无缝推理。这...……更多
Sora为何没能诞生在中国?
...。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。”Sora官网发布的部分由文字生成的视频(截图)。(图/Sora官网)彼时,文生视频模型...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...由齐鲁晚报•齐鲁壹点主办,山东财经大学大数据与人工智能研究院、浪潮智能终端有限公司协办的2023新型智慧媒体建设研讨会将在济南举行。会上,山东省新型智慧媒体重点实验室将展示众多研究成果和拳头产品。目前实验...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
更多关于科技的资讯:
网红吃宵夜晕倒:昏迷8个月去世
12月21日消息,据媒体报道,广东45岁网红麦友煊因病于12月20日离世。据了解,4月13日凌晨,麦友煊吃宵夜突发意外昏迷不醒
2024-12-22 00:02:00
山灵m0s便携无损音乐播放器发布, 24日开售
12月20日消息,山灵官方今日发布M0s便携无损音乐播放器,将于12月24日开售,首发价528元。山灵M0s搭载一块1
2024-12-22 00:11:00
丰田凯美瑞光辉版上市,提供两款不同配置
12月21日消息,广汽丰田凯美瑞光辉版轿车今日正式上市,新车提供两款不同配置,官方指导价分别为 20.28万元和 21
2024-12-22 00:22:00
毛不易冬至送广州一场雪:现场歌迷被震撼到了
12月22日消息,据媒体报道,毛不易在三巡广州站现场演唱《东北民谣》时送了广州一场雪,场馆内飘起了漫天雪花。毛不易表示
2024-12-22 00:32:00
北京星际智造大直径搅拌摩擦焊贮箱成功下线
12月21日消息,北京星际智造科技有限公司官方公众号昨日(12月20日)发布博文,宣布在北京市大兴区,成功下线大直径搅拌摩擦焊贮箱
2024-12-22 00:33:00
特斯拉透露cybertruck隐藏的“彩蛋”设计
12月21日消息,特斯拉Cybertruck赛博皮卡越野车的首席工程师WesMorrill透露,Cybertruck中存在一项隐藏的“彩蛋”设计
2024-12-22 00:36:00
epic2024年假日促销将送16款神秘游戏
12月20日消息,Epic2024年假日促销期间总共将送出16款神秘游戏,《吸血鬼幸存者》现在仍可领取。12月21日0时起
2024-12-22 00:50:00
openkylin2.0sp1发布:内核稳固升级
12月20日消息,OpenAtomopenKylin(以下简称“openKylin”)2.0SP1版本今日正式发布。据介绍
2024-12-22 01:03:00
华硕rog各系列新品sku参数曝光
12月20日消息,爆料者@Huang514613发现华硕ROG多款机型已经在印度、欧洲和英国经销商处上架,他特地整理了ROG各系列新品sku的参数信息
2024-12-22 01:09:00
《双人成行》新作《双影奇境》开启预购
12月21日消息,据Steam商店页面显示,《双人成行》团队新作《SplitFiction》中文名定名为《双影奇境》,游戏现已开启预购
2024-12-22 01:12:00
AT&T计划到2029年底劝说全美国的用户告别固定电话
12月21日消息,据彭博社周五晚间报道,AT&T计划到2029年底劝说全美国的用户告别固定电话。为了实现这一目标
2024-12-22 01:20:00
国产修仙游戏《鬼谷八荒》登陆ios平台
12月21日消息,国产修仙游戏《鬼谷八荒》手游版本现已在移动平台发售,登陆安卓(TapTap)和iOS平台,采用本体买断+DLC付费形式
2024-12-22 01:21:00
小鹏汽车宣布在澳洲首家汽车门店开业
12月21日消息,据小鹏汽车官方微博,小鹏汽车宣布其在澳洲(澳大利亚)的首家汽车门店正式开业,现场主要展示了小鹏G6SUV车型及小鹏飞行汽车
2024-12-22 01:24:00
《暗喻幻想:refantazio》被评为2024年最佳游戏
12月21日消息,IGN在本周五深夜宣布将2024年度最佳游戏的称号授予《暗喻幻想:ReFantazio》。IT之家附官方评语大意如下
2024-12-22 01:35:00
英特尔最新款酷睿ultra9285k性能表现平平
12月20日消息,英特尔最新款酷睿Ultra9285K由于性能表现平平而备受吐槽,但测试结果显示这其中有部分原因在于Windows的适配不达标
2024-12-22 01:51:00