• 我的订阅
  • 头条热搜
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...字小说的内容生成能力;•多,图生小说、文生插图等多模态交互能力;•长,一次读懂长达100万字小说的内容理解力。大:全球首个万字创作大模型,一键生成万字小说唐太宗办亚运会,孙悟空遇到钢铁侠,皮卡丘闯入天空之...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售,库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
本文转自:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司...……更多
...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力,与此同时,在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展...……更多
...事业”。报告总结出人工智能产业发展十个趋势,即:多模态预训练大模型是人工智能产业的标配;高质量数据愈发稀缺将倒逼数据智能飞跃;智能算力无处不在的计算新范式加速实现;人工智能生成内容应用向全场景渗透;人...……更多
...等跟涨。东莞证券研报指出,随着Gen-2、Pika1.0、Gemini等多模态模型的快速涌现,全球大模型多模态化趋势日益显著,有望带动AIGC应用加速落地。展望后续,关注经营边际向好,同时作为AI应用主阵地的游戏、出版、影视、广告营...……更多
科大讯飞股价跌停,市值蒸发120亿元
...升9%,其次是逻辑推理(8%),文本生成、知识问答、多模态能力则均只有7%。此前科大讯飞在8月15日发布星火V2.0时,七大能力大幅度提升,其中语言理解能力提升78%,文本生成、知识问答、数学能力等提升也超70%,逻辑推理能...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
如何让AI精确识别讽刺语言?新多模态算法应运而生
...义,来自荷兰格罗宁根大学的一个研究小组推出了一种多模态算法,这套算法能够提升AI理解讽刺语句的含义。以往AI技术检测语言内容是否具有讽刺含义时,只会基于单个参数进行识别,但如今研究表明这样的算法并不可靠,...……更多
微软新专利:构建多模态3d面部模型
...单,微软公司获得了一项新的专利,通过深度学习构建多模态3D面部模型,可以创建非常逼真的虚拟肖像。这项专利全称为《多模态三维面部建模和跟踪,生成富有表现力的虚拟肖像》,该系统涉及处理器和存储系统,处理器负...……更多
斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前
...l and 500 Dollars》,并开始广而告之:成功训练出一个SOTA多模态模型Llama3-V,性能比GPT-4V、Gemini Ultra、Claude Opus更强,而训练成本仅需500美元。后三个大模型,都是全球范围知名的多模态“巨无霸”。由于团队成员拥有斯坦福(其...……更多
...建立在别人的墙基上,全国政协委员霍金花建议:构建多模态网络环境条件已经成熟本报记者 王有强 靳燕《&nbsp人民政协报 》 (&nbsp2024年03月28日 &nbsp第&nbsp07&nbsp版)“我国现有网络基础设施核心技术受制于人...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
...《智能制造 工业大数据系统功能要求》、《智能制造 多模态数据融合技术要求》、《智能制造 工业大数据时间序列数据采集与存储管理》正式发布,标准由中国电子技术标准化研究院、清华大学牵头,浪潮科技作为行业领军企...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...大学计算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
视频大模型 快手美图殊途同归
...a早成立一个月,主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月,生数科技联合清华大学发布的视频大模型Vidu,支持一键生成16秒、分辨率1080P的高清视频内容。6月初,生数科技宣布,已完成数亿元Pre-A轮...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...,来源于经过数据治理、多维评测的数据工厂。为了将多模态能力搬上了手机,面壁智能还发布了多模态端侧模型MiniCPM-V。通过将手机调整为飞行模式来模仿野外无信号的情况,面壁智能演示了野外生存情况下人与MiniCPM-V的多模...……更多
更多关于科技的资讯:
2025年以旧换新政策出炉:家电新增4个品类;手机、平板也有购新补贴
2025年消费品以旧换新政策出台,这次有哪些新品类进入补贴范围? 万众期待的2025年家电以旧换新政策终于出炉!1月8日
2025-01-12 16:23:00
海外媒体发稿:品牌出海先铸自身影响力“利剑”
品牌出海浪潮正当时在当今全球化的大背景下,品牌出海已然成为众多企业拓展市场、寻求新增长极的必由之路。随着世界经济格局的深度调整
2025-01-12 16:31:00
本文转自:人民网人民网北京1月12日电 (记者栗翘楚)近年来,生成式AI、大语言模型快速发展,医疗服务、医学影像诊断、药物研发等多个领域迎来深刻变革
2025-01-12 19:25:00
CINITY LED专属制版《刺猬索尼克3》放映,国产研发技术为电影带来了什么?
中国青年报客户端讯(中青报·中青网记者 沈杰群)日前,中影科技(北京)有限公司(简称:中影科技)在北京举办《刺猬索尼克3》CINITY LED制版首映影鉴会
2025-01-12 18:24:00
本文转自:人民网人民网记者 王绍绍近年来,“人工智能+”在与千行百业的深度融合中,不断拓展能力边界。从智能制造的自动化生产线到精准医疗的AI辅助诊疗
2025-01-12 19:25:00
法务部出击!Switch 2泄露厂商被任天堂找麻烦了
前段时间,配件厂商Genki在2025年CES展会上展示了一款Switch 2的实体模型,这引发了任天堂法务部关注。据报道
2025-01-12 10:22:00
CFO,全面接管中国互联网大厂
作者:徐晓倩过去一年,中国互联网的权力中心逐渐向CFO倾斜。2024年最后一天,盒马鲜生(以下简称盒马)新任CEO严筱磊宣布
2025-01-12 16:11:00
高速突现事故车 问界M7自动变道刹停!车主:华为智驾保我全家性命
快科技1月12日消息,近日,有问界M7 Ultra车主发布视频称,感谢赛力斯、华为智驾保我全家性命。车主公布的行车记录仪视频显示
2025-01-12 10:22:00
设计不会变了 蔚来萤火虫“三眼灯”确认:辨识度超高
快科技1月12日消息,在去年举办的蔚来NIO DAY上,蔚来第三品牌萤火虫首发,采用了非常独特的“复眼”大灯,这样的方案引发了不少争议
2025-01-12 10:22:00
本文转自:人民网人民网北京1月12日电 (唐佳)1月11日,中国国土经济学会低空经济专业委员会在京成立,并举行了低空经济与国土空间高质量发展论坛
2025-01-12 10:46:00
三轮车逆行全责撞上宾利 修车要几十万!宾利车主走代位追偿引热议
快科技1月12日消息,据报道,近日,浙江衢州,一位卖猪肉的老人开三轮车逆行下山,撞上了正常行驶的宾利欧陆GT轿车。事故现场照片显示
2025-01-12 10:52:00
福特电马突然变砖:婴儿一度被困车内、砸窗解救
快科技1月12日消息,海外媒体报道,近日,美国洛杉矶一辆福特电马电动门突然失灵无法解锁,导致车主9个月大的孩子被困车内将近1小时
2025-01-12 10:52:00
曝新款特斯拉Model Y九大产品核心亮点:舒适性提升占比超一半
快科技1月12日消息,毫无征兆,新款特斯拉Model Y就这样上市开卖了,仅提供两个版本,价格为26.35-30.35万元
2025-01-12 11:22:00
山火失控顶级富人区被烧毁:靠海的洛杉矶为何缺水灭火
1月12日消息,本月7日,美国加利福尼亚州南部地区突发山火,在大风助推下迅速蔓延,从加州南部的洛杉矶烧至好莱坞。好莱坞是富人聚集地
2025-01-12 11:22:00
2025年1月9日,微盟集团宣布推出“微盟X微信小店”系列解决方案,旨在帮助商家在微信小店生态中实现高效整合与业务增长
2025-01-12 11:52:00