• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
...市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献) ……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
大模型“遍地”都是,谁能真正解放生产力?
...市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...aS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...对这一领域关注得很早,有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”,当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多
萤石推出智能家居AI主机!接入自研蓝海大模型,智能手表抬手就能看血糖
...融合难,而且单一产品往往没法解决场景系统问题,所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架,云端大模型为复杂场景问题提供了解法,一些简单问题则由本地小模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...多模态模型」实现了规模与模态的双重突破。在规模上,团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据,创新「跨模动态对齐」技术,融合大语言模型,实现千亿参数视觉语言模型。在模态上,团队建设模态动...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...、Relay Diffusion(ICLR’24)、CogView3 (2024)。基于CogView,团队研发基于大模型的文本到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视...……更多
Sora爆火96小时国内大模型进场
... 查睿春节期间,大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界极大的震撼,网友惊呼“现实不存在了”。发布短短96个小时内,国内已...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
近日,2024世界人工智能大会(WAIC 2024)期间,中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al,智能体重新定义世界”自主智能+创新应用论坛,该论坛是本次世界人工智能大会核心专业论坛...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。若愚科技是一支源自哈工大的团队,创立于2023年,旨在通过多模态大模型技术打造机器人大脑。公司创始人聂礼强现任哈尔滨工业大学(深圳)计算机...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。多模态的意义在于,为AI应用带来更多的可能性...……更多
...24日 第 09 版)本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...更懂中国用户。在语言模型客观评测中,OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。多模态理解模型客观评测结果显示,图文问答方面,阿里巴巴...……更多
不要小看「实而不华」的腾讯 AI
...纲等新功能,大大提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了 38%...……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...资源与AI行业的数据需求通道打通,我们成立了Coohom Cloud团队,这是团队专门面向前沿科学领域,以高性能渲染和数据加工能力,将群核科技的数字矿山提炼为AI行业所需要的各种数字燃料,包括视频集,3D数据集等。大家可以看...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...”背后过去一年,百模大战如火如荼,国内外不少大模型团队热衷于跑分与对标。李彦宏则在多个公开场合向行业呼吁应用的重要性,称“要卷AI原生应用,不要卷大模型”。在不久前的一次访谈中,李彦宏在回应什么是百度战...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...储备,做好前瞻技术布局,横向扩展AI使用场景。4、初创团队引领下游硬件多点开花,重量级硬件应用涌现可期“人工智能技术+互联网平台”给传统行业带去创新动力,AI下流应用层出不穷,未来有可能出现颠覆性的应用。我们...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
... 30 个测试集的性能超过当前 SOTA 结果。 Gemini是谷歌各个团队大规模合作的成果,包括谷歌研究院的研究者,这个模型从发布之初就定位为原生多模态结构,这意味着它能够跨越文本、图像、视频、音频和代码进行无缝推理。这...……更多
Sora为何没能诞生在中国?
...。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。”Sora官网发布的部分由文字生成的视频(截图)。(图/Sora官网)彼时,文生视频模型...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...由齐鲁晚报•齐鲁壹点主办,山东财经大学大数据与人工智能研究院、浪潮智能终端有限公司协办的2023新型智慧媒体建设研讨会将在济南举行。会上,山东省新型智慧媒体重点实验室将展示众多研究成果和拳头产品。目前实验...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
更多关于科技的资讯:
曝华为Pura 80 Art有望回归:旗舰手机设计标杆
快科技12月28日消息,博主定焦数码暗示,华为Pura 80 Art有望回归,定位跟非凡大师系列类似。资料显示,华为2023年3月推出了P60 Art
2024-12-28 23:09:00
农业银行全疆首家贵金属旗舰店亮相 市民可一站式“淘金”
新疆网讯 12月27日, 由中国农业银行乌鲁木齐分行打造的全疆首家贵金属旗舰店,在农业银行乌鲁木齐天山区支行正式营业,消费者可一站式获得贵金属鉴赏
2024-12-28 22:27:00
57岁阿姨演短剧:享受与年轻人竞争的乐趣
12月28日消息,据媒体报道,最近一段时间,微短剧走红网络,这些剧涉及的题材五花八门,以快节奏、高密度、强冲突、多反转著称
2024-12-28 22:39:00
国际知名动漫平台中国首店落户南京,打造二次元新地标
江南时报讯(记者 邓雯婷)12月28日上午,国际知名动漫平台“布雷福思朵”中国大陆首店在南京夫子庙水游城落户,吸引了众多动漫迷与消费者的关注
2024-12-28 22:46:00
“地下51米的南京”刷屏 网友直呼犹如飞龙在天
快科技12月28日消息,今天,南京地铁7号线中段正式开通运营,标志着全线实现贯通。其中,清凉山站作为南京最深的地铁站,一经亮相便在南京人的朋友圈里刷屏
2024-12-28 20:09:00
16岁男孩每天只睡5小时头秃了 医生:睡眠不足 精神压力大导致
12月28日消息,微博话题“16岁男孩每天只睡5小时头先秃了”引发热议。据媒体报道,16岁的小周由妈妈带至医院脱发门诊就诊
2024-12-28 20:09:00
华为之后全球第二家!三星三折叠屏曝光
快科技12月28日消息,博主定焦数码爆料,除华为外,目前只有三星在布局三折叠屏,其他家都没有三折或者折叠PC的计划,不过三星三折叠屏难以做到大规模的铺货
2024-12-28 20:39:00
00后女孩独自一人野外露营 帐篷内烧炭取暖差点殒命
据湖南消防12月28日消息,近日,湖南省郴州市桂东县发生了一起紧急救援事件。一名女子在深夜拨打报警电话,声音急促且含糊不清
2024-12-28 21:09:00
2024贺岁档票房破25亿:《小小的我》成黑马
快科技12月28日消息,据灯塔专业版,截至今晚19时09分,2024年贺岁档(11月22日—12月31日)档期票房(含预售)突破25亿
2024-12-28 21:09:00
量增价低持续 快递业争降本:预计明年无人车无人机应用加速
2024年,快递件量已突破1500亿件,增速仍高。国家邮政局本月公布的数据显示,今年1-11月,快递业务量累计完成1572
2024-12-28 22:09:00
男子开小米SU7一年游历38个国家:倍感自豪 此生无憾
快科技12月28日消息,今天,小米汽车正式步入一周年。与此同时,“小米车主故事”专栏正式开启,记录真实美好的个人故事,他们也许职业不同
2024-12-28 17:09:00
警惕超大显存的魔改显卡:买了就后悔
如果比较关注低价显卡,你或许会发现最近的魔改显卡多了好多,尤其是某鱼有很多超大显存的显卡,比如860元的魔改RX5600拥有12GB显存
2024-12-28 17:09:00
国产芯新成就!飞腾系列国产CPU总销量突破1000万片
快科技12月28日消息,据官方公布消息显示,中国电子飞腾系列国产CPU总销量突破1000万片。中国电子飞腾系列国产CPU总销量近日突破1000万片
2024-12-28 17:09:00
在如今蓬勃发展的手游市场中,手游联运平台成为了众多游戏从业者关注的焦点。那么,手游联运平台究竟有哪些独特的玩法呢?首先
2024-12-28 17:10:00
本文转自:人民网嫦娥六号月球背面“挖宝”归来、中国空间站上演两次在轨“换班”、长三乙火箭跨入“百次发射俱乐部”....
2024-12-28 17:17:00