• 我的订阅
  • 头条热搜
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...追求通用人工智能改变生活的同时,需要关注 AI 对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
【新智元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务...……更多
...经济网中国经济网北京5月22日讯 近期,OpenAI发布全新大模型GPT-4o,再度引发市场对于AI的关注。对此,景顺长城基金股票投资部基金经理张雪薇分析了GPT-4o对于AI行业的发展意义,并指出,AI目前看仍是比较确定的长期主线。 投...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...据集上,GLM-4的得分为72分,超过了GPT-3.5和GPT-4。在中文指令跟随方面,GLM-4达到了GPT-4的88%至90%水平。此外,GLM-4在对齐能力上也超过了GPT-4的早期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...智谱AI推出了GLMs 个性化智能体定制,用户用简单提示词指令即能创建属于自己的 GLM 智能体,无需编程基础;面向B端客户,GLM-4已登陆MaaS(Model as a Service)平台,提供API访问。要充分释放大模型的价值,从基础大模型到上层应...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗台”等画面,增加亲子互动和乘车乐趣。通过优化算法、蒸馏模型,大模型在确保图片质量的前提下可做到5秒出图,将出图时间缩...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也对认...……更多
...臂协作系统RTACS,该模型能使机器人理解推理抽象的语义指令,并调度双臂协作系统执行任务。此前,仅OpenAI等国外人工智能头部企业发布了类似成果。此次发布,标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...性的标题。因此,该模型能够更精准遵循生成用户的文本指令。OpenAI表示,Sora是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...B可以处理最多32k的长文本输入,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集,名为 LLaVA-Video-178K。该数据集包含详细的视频的描述、开放式问答(QA)、和多项选择题。通过在该数据集和现有的视觉指令微调...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
始于去年的AI(人工智能)大模型浪潮热度再次升温。农历春节期间,AI领域利好不断,以Open AI为首的诸多国内外互联网龙头公司均迎来AI大模型技术的新进展。多家机构及业内人士称,看好未来AIGC(人工智能生成内容)产业发...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...,它需要建立在一个非常坚实的基础模型上,具有很强的指令跟随能力、理解能力、反思能力和执行能力。在计算环境方面,林达华表示,芯片进入到后摩尔定律时代,未来算力会变成体量的拓展,越来越多的芯片连接在一起,...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...3.0”AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构...……更多
中国杀出全球首个烹饪大模型“食神”
...模型了解各种设备性能、参数知识;还有场景任务、控制指令学习,让大模型掌握设备执行、任务规划和推理的能力。掌握了多设备协同控制的能力,那么再结合菜谱知识,温度感知等方面的能力,那么菜谱生成也就不在话下了...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。刚一发布,就已经有开发者跃跃欲试:并收获了好评: 与前序模型相比,Yi-1.5 系列模型进一步提升了编码、...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
...工作人员通过华藏输入“帮我生成一张万里长城的照片”指令,华藏即时给出了相应的图片。而当他继续提出“把万里长城变成雪景”指令时,华藏可以根据上下文语境,对图片进行相应指令的修改——万里长城瞬间平添皑皑雪...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...致大模型对机器人执行代码与外部环境不适配,从而降低指令分解能力和执行成功率。同时,云端加载的大模型也会带来时延的问题,制约了基于大模型驱动的多型机器人的域适应能力。若愚科技致力于通用机器人大脑的研究,...……更多
自然语言处理:大模型理论与实践
...自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中的自然语言理解和生成任务,多模态指令微调的数据构造和模型微调方法,以及指令微调优化方法和效果。-...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...冻结;在SFT阶段,MLP投影器和LLM都需要训练以学习带有新指令的新视觉-语言任务,且保持视觉编码器冻结。以往文献中很少讨论的是,在多模态SFT训练期间不冻结LLM权重通常会导致纯文本性能显著下降,NVLM-D模型通过整合高质...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的...……更多
vivo6g技术再突破,多款原型机首次亮相
...,并与智能家居系统无缝对接。用户只需通过简单的语音指令,就能轻松控制家居设备,享受智能家居带来的便捷生活。同时,vivo生态产品全面支持Matter协议,这一智能家居通用语言已覆盖五种常用品类,Matter生态中更是有超...……更多
更多关于科技的资讯:
PCB印制电路板气泡形成原因,造物数科来揭秘
在当今快速发展的电子工业中,PCB(印制电路板)作为电子设备的重要组成部分,其质量和性能直接影响着整个产品的可靠性和稳定性
2025-03-11 17:33:00
大皖新闻讯 最近,海尔集团董事局主席、首席执行官周云杰与雷军在全国两会代表通道同框亮相,意外爆火。与此同时,“海尔被曝要求强制双休”“《海尔兄弟》续集何时推出”引发热议
2025-03-11 17:41:00
三方桩兼容度超99.5%!2025款小鹏G6 5C超充实测:功率满运转
快科技3月11日消息,小鹏汽车对2025款小鹏G6进行了预热,该车型将在3月13日19:00的春季发布会上正式亮相。小鹏汽车表示
2025-03-11 17:49:00
腾讯、阿里都碰壁!梁文锋拒绝投资:不想用DeepSeek赚快钱
快科技3月11日消息,据媒体报道,DeepSeek创始人梁文锋拒绝了通过其大模型赚快钱的投资提议,他表示希望保持对科学研究的专注
2025-03-11 17:49:00
曝比亚迪超充技术下沉:秦L EV将配800V平台、5C超充
快科技3月11日消息,据“汽车像素”报道,为增加纯电车型的竞争力和用户使用体验,比亚迪正集中升级纯电新车的快充能力。比亚迪即将发布的新款秦L EV车型
2025-03-11 17:49:00
苹果为何要给下一代AirPods加摄像头:原因揭开
知名记者Mark Gurman透露,苹果正在积极研发一款搭载摄像头的新一代AirPods Pro耳机,最快有望在今年推出
2025-03-11 17:49:00
500万粉网红滑雪摔骨折:打24颗钉子
3月11日消息,据媒体报道,近日,拥有500多万粉丝的女网红千一更新动态,跟粉丝们展示自己的近况。此前她在滑雪时摔倒,断了4根骨头
2025-03-11 17:49:00
全球手机产量排名:小米稳居国产第一 国补神助攻
快科技3月11日消息,TrendForce集邦咨询今天发布了2024年第四季度全球手机产量报告,本季度全球前六大智能手机品牌合计产量达3
2025-03-11 17:49:00
阿里系进军具身智能和机器人 落地上海浦东
快科技3月11日消息,今天,上海蚂蚁灵波科技有限公司在上海浦东举行揭牌仪式。蚂蚁灵波科技是蚂蚁集团拓展具身智能和机器人业务的主要载体
2025-03-11 17:49:00
大楼荒废湖中影子却“灯火通明” :专家解释神秘倒影成因
快科技3月11日消息,近日一段由网友拍摄的“诡异”视频在网络上流传,引发了不少人关注和争论。上月28日早晨,山东临沂市民孙先生在自家里远眺时发现了奇特的一幕
2025-03-11 17:49:00
\
本文转自:人民网-江西频道南昌市安义县烟草专卖局:"云" 端服务解民忧 双向奔赴暖人心烟雨朦胧的文峰路,零售户李老板站在店门口擦拭额头细汗
2025-03-11 18:02:00
煤矿安全无小事,九测科技酒精检测仪为井口检身系统增添安全保障
众所周知,煤矿作业环境错综复杂,矿工们时常在狭窄、潮湿且光线不足的巷道中从事高强度的体力劳动。在这样的极端条件下,矿工们的身体状况与精神面貌对于保障安全生产具有举足轻重的意义
2025-03-11 18:07:00
贵州智造一分钟里,看见了什么?
一分钟,能做什么?在贵州吉利发动机工厂,42秒完成1台汽车发动机装配;在贵州中航电梯有限责任公司,是1台电梯的全部零部件生产程序的完成
2025-03-11 18:11:00
猫眼被指赤裸裸数据抄袭!回应:已于服务商说明情况
快科技3月11日消息,近日,影视数据平台CMDB在公开发文指出: “猫眼专业版”有些影片的演职人员信息并非来自于影片片尾字幕
2025-03-11 18:19:00
下载速率10047Mbps!华为联手打造湖北省首个联通万兆小区
快科技3月11日消息,近日,湖北联通携手华为在武汉万科高尔夫城市花园成功建成省内首个联通万兆小区,开启湖北省家庭网络“万兆新时代”
2025-03-11 18:19:00