• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
...市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献) ……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
大模型“遍地”都是,谁能真正解放生产力?
...市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...aS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...对这一领域关注得很早,有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”,当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多
萤石推出智能家居AI主机!接入自研蓝海大模型,智能手表抬手就能看血糖
...融合难,而且单一产品往往没法解决场景系统问题,所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架,云端大模型为复杂场景问题提供了解法,一些简单问题则由本地小模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...多模态模型」实现了规模与模态的双重突破。在规模上,团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据,创新「跨模动态对齐」技术,融合大语言模型,实现千亿参数视觉语言模型。在模态上,团队建设模态动...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...、Relay Diffusion(ICLR’24)、CogView3 (2024)。基于CogView,团队研发基于大模型的文本到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视...……更多
Sora爆火96小时国内大模型进场
... 查睿春节期间,大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界极大的震撼,网友惊呼“现实不存在了”。发布短短96个小时内,国内已...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
近日,2024世界人工智能大会(WAIC 2024)期间,中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al,智能体重新定义世界”自主智能+创新应用论坛,该论坛是本次世界人工智能大会核心专业论坛...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。若愚科技是一支源自哈工大的团队,创立于2023年,旨在通过多模态大模型技术打造机器人大脑。公司创始人聂礼强现任哈尔滨工业大学(深圳)计算机...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。多模态的意义在于,为AI应用带来更多的可能性...……更多
...24日 第 09 版)本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...更懂中国用户。在语言模型客观评测中,OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。多模态理解模型客观评测结果显示,图文问答方面,阿里巴巴...……更多
不要小看「实而不华」的腾讯 AI
...纲等新功能,大大提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了 38%...……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...资源与AI行业的数据需求通道打通,我们成立了Coohom Cloud团队,这是团队专门面向前沿科学领域,以高性能渲染和数据加工能力,将群核科技的数字矿山提炼为AI行业所需要的各种数字燃料,包括视频集,3D数据集等。大家可以看...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...”背后过去一年,百模大战如火如荼,国内外不少大模型团队热衷于跑分与对标。李彦宏则在多个公开场合向行业呼吁应用的重要性,称“要卷AI原生应用,不要卷大模型”。在不久前的一次访谈中,李彦宏在回应什么是百度战...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...储备,做好前瞻技术布局,横向扩展AI使用场景。4、初创团队引领下游硬件多点开花,重量级硬件应用涌现可期“人工智能技术+互联网平台”给传统行业带去创新动力,AI下流应用层出不穷,未来有可能出现颠覆性的应用。我们...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
... 30 个测试集的性能超过当前 SOTA 结果。 Gemini是谷歌各个团队大规模合作的成果,包括谷歌研究院的研究者,这个模型从发布之初就定位为原生多模态结构,这意味着它能够跨越文本、图像、视频、音频和代码进行无缝推理。这...……更多
Sora为何没能诞生在中国?
...。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。”Sora官网发布的部分由文字生成的视频(截图)。(图/Sora官网)彼时,文生视频模型...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...由齐鲁晚报•齐鲁壹点主办,山东财经大学大数据与人工智能研究院、浪潮智能终端有限公司协办的2023新型智慧媒体建设研讨会将在济南举行。会上,山东省新型智慧媒体重点实验室将展示众多研究成果和拳头产品。目前实验...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
更多关于科技的资讯:
英特尔锐炫b580“公版”显卡金手指曝光
12月13日消息,日媒 ASCII.jp在对英特尔锐炫B580LimitedEdition“公版”显卡评测时指出,这张仅支持PCIe4
2024-12-14 01:26:00
纯血鸿蒙版微信app开启测试版升级
12月12日消息,纯血鸿蒙版微信App今日在华为应用市场(AppGallery)开启测试版 1.0.2.39(1049127)邀测升级
2024-12-14 01:34:00
高通正积极推进glymur计划
12月13日消息,消息源RolandQuandt于12月10日在BlueSky平台发布动态,透露高通正积极推进Glymur计划
2024-12-14 01:52:00
华为携手香港大学打造全球智慧校园网络创新示范项目
12月13日消息,华为携手香港大学(IT之家注:以下简称“港大”)12月12日举办“全球智慧校园网络创新中心发布仪式”
2024-12-14 01:54:00
微软bing必应搜索已移出网页缓存链接
12月13日消息,据微软必应Webmaster团队官方X平台账户动态,微软Bing必应搜索已于本周从结果页面移出了网页缓存链接
2024-12-14 01:56:00
微软邀请edge浏览器用户测试“ocrforpdf”功能
12月13日消息,科技媒体WindowsLatest昨日(12月12日)发布博文,报道称微软正邀请部分Edge浏览器用户
2024-12-14 02:48:00
华为真无线蓝牙耳机freebudsse3开启预售
华为最新款真无线蓝牙耳机FreeBudsSE3于12月12日正式发布,并在华为商城及授权电商平台开启预售,官方指导价为199元
2024-12-14 03:18:00
《幻兽帕鲁》将于2024年12月23日更新天坠之地
12月13日消息,Pocketpair开发商在2024TGA游戏大奖上,正式宣布将于2024年12月23日,为《幻兽帕鲁》(Palworld)游戏推出大型更新“天坠之地”(Feybreak)
2024-12-14 03:25:00
《天外世界2》最新宣传片展示了战斗、武器和画面等细节
12月13日消息,黑曜石娱乐(Obsidian)在2024TGA游戏大展上,放出了《天外世界2》(TheOuterWorlds2)游戏的最新宣传视频
2024-12-14 03:29:00
《鬼武者:剑之道》将于2026年发售,宣传片显示游戏换新主角
12月13日消息,卡普空在今日的TGA2024颁奖典礼上公布了《鬼武者》系列的回归作品——《鬼武者:剑之道》。《鬼武者
2024-12-14 03:31:00
奇瑞集团首款高端豪华MPV星纪元E8首轮冬标车下线
12月13日消息,奇瑞汽车旗下星途营销中心总经理黄招根今日宣布,奇瑞集团首款高端豪华MPV星纪元E8首轮冬标车下线(IT之家注
2024-12-14 03:38:00
广汽国际欧洲办公室正式揭牌,位于荷兰首都阿姆斯特丹
12月13日消息,广汽集团昨日晚间宣布,广汽国际欧洲办公室正式揭牌。广汽国际欧洲办公室位于荷兰首都阿姆斯特丹,负责广汽自主品牌在欧洲的市场开拓
2024-12-14 03:57:00
宝马全新空气声学和电驱中心投入运营
12月13日消息,宝马集团于当地时间12月11日宣布,经过三年的建设,全新空气声学和电驱中心(AEC)已投入运营。IT之家获悉
2024-12-14 04:39:00
hmdglobal推出arc手机,定位低端
12月13日消息,HMDGlobal悄悄推出了一款HMDArc手机,该机定位低端,目前已上架官网,采用“紫光展锐9863A处理器+4GBRAM+64GB存储空间”规格
2024-12-14 04:47:00
《解限机》新预告发布:2025年春季上线
12月13日消息,在今天上午的TGA2024颁奖仪式上,西山居公布了旗下科幻机甲游戏《解限机》的新预告。在预告视频的末尾
2024-12-14 04:59:00