• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009...……更多
...市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献) ……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...模态大模型中处理自由形式区域输入的成果。”项目研发团队在论文中写道。Ferret 是一种新颖的引用与定位多模态大语言模型(MLLM)。之所以选择多模态大模型作为 Ferret 的设计前提,是因为其拥有强大的视觉语言全局理解能...……更多
大模型“遍地”都是,谁能真正解放生产力?
...市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地的抱怨,正致力于解决以上困境,给出两全法。相较于其他两百多个大...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...aS(模型即服务)服务和To C的应用产品。生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...对这一领域关注得很早,有深厚的历史沉淀和技术积累。团队在早期就成立了 “几何感知与智能实验室”,当时这一领域尚未被大家所熟知的 “大厂” 涉足。我们是中国最早将人工智能技术应用于三维等非欧数据的学者和团队...……更多
萤石推出智能家居AI主机!接入自研蓝海大模型,智能手表抬手就能看血糖
...融合难,而且单一产品往往没法解决场景系统问题,所以团队做这款产品时是想解决复杂场景下缺乏统一系统方案的问题。智能家居AI主机采用端云协同框架,云端大模型为复杂场景问题提供了解法,一些简单问题则由本地小模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...多模态模型」实现了规模与模态的双重突破。在规模上,团队积累了万亿级别的文本语料与百亿级图文、视频、音频数据,创新「跨模动态对齐」技术,融合大语言模型,实现千亿参数视觉语言模型。在模态上,团队建设模态动...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...、Relay Diffusion(ICLR’24)、CogView3 (2024)。基于CogView,团队研发基于大模型的文本到视频生成模型CogVideo,采用了多帧率分层训练策略生成高质量的视频片段,提出一种基于递归插值的方法,逐步生成与每个子描述相对应的视...……更多
Sora爆火96小时国内大模型进场
... 查睿春节期间,大洋彼岸又放出大招——美国人工智能团队OpenAI发布“文字生成视频”大模型Sora,特别是官方公布的长达60秒未经修改的AI视频,引发业界极大的震撼,网友惊呼“现实不存在了”。发布短短96个小时内,国内已...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱清言打造的视频创作智能体,清影依托于智谱大模型团队自研打造的视频生成大模型CogVideoX,现已支持文生视频、图生视频多个能力,让用户“自助式”地完成艺术视频创作,首发测试期间,所有用户均可免费使用。同时,...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
近日,2024世界人工智能大会(WAIC 2024)期间,中国移动产业链发展基金与杭州联汇科技股份有限公司在上海世博中心联合主办“Om Al,智能体重新定义世界”自主智能+创新应用论坛,该论坛是本次世界人工智能大会核心专业论坛...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...其中Semi 赛道第一名由社交平台 Soul App 摘得,其语音技术团队凭借可行性创新技术方案拔得头筹。 不过,在揭秘 Soul 团队技术方案之前,我们有必要先来了解 AI 在多种模态中的情感识别能力。人机交互下一步要让 AI 懂情感如...……更多
...机器人“Samantha”用充满智慧和幽默的回答展示出高度的智能性和适应性。当下,这些来自过去的科幻想象正加速照入现实中。北京时间5月14日凌晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...。本开源项目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远、王恺乐、洪东海...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...in.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。若愚科技是一支源自哈工大的团队,创立于2023年,旨在通过多模态大模型技术打造机器人大脑。公司创始人聂礼强现任哈尔滨工业大学(深圳)计算机...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...音频、视频和代码等,这使得AI基础能力更具多样性。在智能营销领域,Gemini的推出将进一步优化用户体验并降低成本,诸如文本、图像、视频等都将进入到“能听会看”的时代。多模态的意义在于,为AI应用带来更多的可能性...……更多
...24日 第 09 版)本报电 (记者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...更懂中国用户。在语言模型客观评测中,OpenAI GPT-4、百川智能Baichuan3位列第一、第二。百度文心一言4.0、智谱华章GLM-4和月之暗面Kimi均进入语言模型主客观评测前五。多模态理解模型客观评测结果显示,图文问答方面,阿里巴巴...……更多
不要小看「实而不华」的腾讯 AI
...纲等新功能,大大提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了 38%...……更多
群核科技(酷家乐)陈卓:用多模态AI助理赋能设计产业,用合成数据服务反哺AI | 新质生产力·AI Partner大会
...资源与AI行业的数据需求通道打通,我们成立了Coohom Cloud团队,这是团队专门面向前沿科学领域,以高性能渲染和数据加工能力,将群核科技的数字矿山提炼为AI行业所需要的各种数字燃料,包括视频集,3D数据集等。大家可以看...……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...”背后过去一年,百模大战如火如荼,国内外不少大模型团队热衷于跑分与对标。李彦宏则在多个公开场合向行业呼吁应用的重要性,称“要卷AI原生应用,不要卷大模型”。在不久前的一次访谈中,李彦宏在回应什么是百度战...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...储备,做好前瞻技术布局,横向扩展AI使用场景。4、初创团队引领下游硬件多点开花,重量级硬件应用涌现可期“人工智能技术+互联网平台”给传统行业带去创新动力,AI下流应用层出不穷,未来有可能出现颠覆性的应用。我们...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
... 30 个测试集的性能超过当前 SOTA 结果。 Gemini是谷歌各个团队大规模合作的成果,包括谷歌研究院的研究者,这个模型从发布之初就定位为原生多模态结构,这意味着它能够跨越文本、图像、视频、音频和代码进行无缝推理。这...……更多
Sora为何没能诞生在中国?
...。刘子纬向《中国新闻周刊》介绍,去年起,国际上已有团队在探索利用DiT架构训练文生视频模型,包括其所在团队。“这是很自然的选择。”Sora官网发布的部分由文字生成的视频(截图)。(图/Sora官网)彼时,文生视频模型...……更多
多款技术产品问世!山东省新型智慧媒体重点实验室亮点纷呈
...由齐鲁晚报•齐鲁壹点主办,山东财经大学大数据与人工智能研究院、浪潮智能终端有限公司协办的2023新型智慧媒体建设研讨会将在济南举行。会上,山东省新型智慧媒体重点实验室将展示众多研究成果和拳头产品。目前实验...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...大模型玩手机”。如图 2 所示,不同于现有的研究,研究团队考虑即使用户和平台都是无害的,在现实世界中部署时,GUI Agent 不可避免地会面临多种信息的干扰,阻碍智能体完成用户目标。更糟糕的是,GUI Agent 可以在私有设备...……更多
更多关于科技的资讯:
江苏镇江:数实融合,推动“制造”迈向“智造”
日前,镇江市举办人工智能技术与数字经济发展“科创先锋”沙龙会议,围绕人工智能技术和数字经济的发展路径展开深入探讨,共谋科技赋能镇江高质量发展的新举措
2024-12-04 19:53:00
本文转自:人民网-河北频道“来对了!这次进博会共带来8件‘衣植染’新品,其中服饰展品,不一会儿就被抢购一空了。”日前,在刚刚结束的中国国际进口博览会上
2024-12-04 19:56:00
本文转自:人民网-江西频道近年来,江西赣州信丰县市场监管局将实施企业首席质量官制度作为质量强企、质量强链的重要抓手,严格落实企业质量主体责任
2024-12-04 20:01:00
湖北牧轩电子:产线扩容一倍 发力海外市场
十堰广电讯(全媒体记者 叶旭升 郧阳区融媒记者 郝周)眼下,正是决胜四季度的黄金期、冲刺期。十堰各地工业企业紧盯全年目标任务
2024-12-04 20:04:00
哈弗H9在路边围挡飞檐走壁 奇瑞小蚂蚁跟风模仿尴尬被卡
快科技12月4日消息,有些老司机艺高人胆大,开车上路不走寻常路,路边的斜坡围挡也敢开车上去冲一冲。网友分享的行车记录仪视频显示
2024-12-04 20:08:00
预计小米汽车明年销量可达36万辆 直接翻三倍!
根据36kr发布的最新数据,多家新造车公司对于2025年的销量预测均表现出强劲的增长势头,其中小米汽车更是定下了近乎翻倍的销量目标
2024-12-04 20:08:00
亚马逊推出第三代AI训练芯片Trainum3:3nm制程、性能翻倍
快科技12月4日消息,据报道,亚马逊推出了第三代AI训练芯片Trainum3。据悉,新款芯片是首款采用3nm工艺节点制造的AWS芯片
2024-12-04 20:08:00
【“一网统管 一网通办”加速跑】结合黔南大数据行业实际 采取相关措施并落实
多彩贵州网·众望新闻讯(记者 雷小露) 12月4日,记者从黔南州大数据发展管理局新闻发布会上获悉,今年初,国家数据局等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》
2024-12-04 20:09:00
旺旺饮料业务将迎爆发式增长,首批受益的是江苏经销商
市场信号很明显,旺旺的饮料业务即将迎来大爆发,而且,首批爆发增长的区域就在江苏市场。今年,旺旺饮料业务动作频频,集团公子蔡旺庭出任新帅
2024-12-04 20:13:00
英国海归青年Nick创立Finx,以小众赛道创业撬动全球市场
在奢侈品手表行业日益受到关注的背景下,一位英国海归青年Nick凭借其敏锐的商业嗅觉和创新精神,成功在手表保护膜这一小众赛道上创业
2024-12-04 20:16:00
高能环境助推金昌经开区新型工业化高质量发展
作为甘肃省最早批准设立的开发区之一,成立于1988年的金昌市经开区2010年被国务院批准升级为国家级经开区。近年来,金昌市坚持把高端化
2024-12-04 20:19:00
ZRO零度荣膺第31届中国国际广告节指定皮鞋品牌
怀大国匠心,造品质好货。2024年11月28日,第31届中国国际广告节大国好货嘉年华在福建厦门国际会议展览中心B1馆盛大启幕
2024-12-04 20:21:00
湖北精益高精:瞄准细分领域 提升市场份额
十堰广电讯(全媒体记者 徐静 通讯员 冯倩钰)位于十堰市张湾区的湖北精益高精铜板带有限公司,这两天,企业最新研发的散热器用铜带箔即将发往长三角
2024-12-04 20:34:00
揭秘:全媒体运营的大误区,90%的人都踩坑了!
全媒体,简而言之就是跨越了多种媒介形式的综合传播体系。这不仅仅是文字、图像,还包括视频、音频等各种形式的内容。相比传统媒体的单一形式传播
2024-12-04 20:38:00
第一枚24手猎鹰9号火箭诞生!
北京时间12月4日18点43分,SpaceX发射了又一枚猎鹰9号火箭,箭体编号B1067.24,全球第一枚24手的猎鹰9号诞生了
2024-12-04 20:38:00