• 我的订阅
  • 头条热搜
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...追求通用人工智能改变生活的同时,需要关注 AI 对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
【新智元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务...……更多
...经济网中国经济网北京5月22日讯 近期,OpenAI发布全新大模型GPT-4o,再度引发市场对于AI的关注。对此,景顺长城基金股票投资部基金经理张雪薇分析了GPT-4o对于AI行业的发展意义,并指出,AI目前看仍是比较确定的长期主线。 投...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...据集上,GLM-4的得分为72分,超过了GPT-3.5和GPT-4。在中文指令跟随方面,GLM-4达到了GPT-4的88%至90%水平。此外,GLM-4在对齐能力上也超过了GPT-4的早期版本,并接近最新版本的表现。此外,GLM-4还增强了多模态能力,其CogView3模型在...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...智谱AI推出了GLMs 个性化智能体定制,用户用简单提示词指令即能创建属于自己的 GLM 智能体,无需编程基础;面向B端客户,GLM-4已登陆MaaS(Model as a Service)平台,提供API访问。要充分释放大模型的价值,从基础大模型到上层应...……更多
小米“小爱同学”与阿里云通义大模型展开合作
...汽车SU7为例,车上的“小爱同学”可遵从乘客的自然语言指令,在车载中控屏画出“小猫爬上窗台”等画面,增加亲子互动和乘车乐趣。通过优化算法、蒸馏模型,大模型在确保图片质量的前提下可做到5秒出图,将出图时间缩...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,并发布讯飞星火4.0 Turbo:七大核心能力全面超过GPT-4 Turbo,数学和代码能力超越GPT-4o,国内外中英文14项主流测试集中讯飞星火4.0 Turbo实现9项第一。与此...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也对认...……更多
...臂协作系统RTACS,该模型能使机器人理解推理抽象的语义指令,并调度双臂协作系统执行任务。此前,仅OpenAI等国外人工智能头部企业发布了类似成果。此次发布,标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...性的标题。因此,该模型能够更精准遵循生成用户的文本指令。OpenAI表示,Sora是能够理解和模拟现实世界的模型基础,相信这一功能将成为实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
...B可以处理最多32k的长文本输入,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮...……更多
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
...这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集,名为 LLaVA-Video-178K。该数据集包含详细的视频的描述、开放式问答(QA)、和多项选择题。通过在该数据集和现有的视觉指令微调...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
【新智元导读】全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出...……更多
始于去年的AI(人工智能)大模型浪潮热度再次升温。农历春节期间,AI领域利好不断,以Open AI为首的诸多国内外互联网龙头公司均迎来AI大模型技术的新进展。多家机构及业内人士称,看好未来AIGC(人工智能生成内容)产业发...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...,它需要建立在一个非常坚实的基础模型上,具有很强的指令跟随能力、理解能力、反思能力和执行能力。在计算环境方面,林达华表示,芯片进入到后摩尔定律时代,未来算力会变成体量的拓展,越来越多的芯片连接在一起,...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...3.0”AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构...……更多
中国杀出全球首个烹饪大模型“食神”
...模型了解各种设备性能、参数知识;还有场景任务、控制指令学习,让大模型掌握设备执行、任务规划和推理的能力。掌握了多设备协同控制的能力,那么再结合菜谱知识,温度感知等方面的能力,那么菜谱生成也就不在话下了...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...持续预训练版本,使用 500B 个 token 来提高编码、推理和指令执行能力,并在 300 万个指令调优样本上进行了精细调整。刚一发布,就已经有开发者跃跃欲试:并收获了好评: 与前序模型相比,Yi-1.5 系列模型进一步提升了编码、...……更多
...工作人员通过华藏输入“帮我生成一张万里长城的照片”指令,华藏即时给出了相应的图片。而当他继续提出“把万里长城变成雪景”指令时,华藏可以根据上下文语境,对图片进行相应指令的修改——万里长城瞬间平添皑皑雪...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...致大模型对机器人执行代码与外部环境不适配,从而降低指令分解能力和执行成功率。同时,云端加载的大模型也会带来时延的问题,制约了基于大模型驱动的多型机器人的域适应能力。若愚科技致力于通用机器人大脑的研究,...……更多
自然语言处理:大模型理论与实践
...自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中的自然语言理解和生成任务,多模态指令微调的数据构造和模型微调方法,以及指令微调优化方法和效果。-...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...冻结;在SFT阶段,MLP投影器和LLM都需要训练以学习带有新指令的新视觉-语言任务,且保持视觉编码器冻结。以往文献中很少讨论的是,在多模态SFT训练期间不冻结LLM权重通常会导致纯文本性能显著下降,NVLM-D模型通过整合高质...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的...……更多
vivo6g技术再突破,多款原型机首次亮相
...,并与智能家居系统无缝对接。用户只需通过简单的语音指令,就能轻松控制家居设备,享受智能家居带来的便捷生活。同时,vivo生态产品全面支持Matter协议,这一智能家居通用语言已覆盖五种常用品类,Matter生态中更是有超...……更多
更多关于科技的资讯:
手机放胸口2分钟就能发现致命心脏病 准确率89%
心力衰竭(心衰)是各种心脏疾病的严重表现或晚期阶段,一旦被诊断心衰,可能需要反复住院治疗,5 年内死亡的风险高达 51
2024-12-24 00:04:00
小鹏汽车2025年产品规划曝光:3款全新车型 4款改款
12月23日晚,有汽车博主披露了小鹏汽车针对2025年的产品部署,计划推出3款全新车型及4款重大改款车型,阵容相当强大
2024-12-24 00:04:00
人类身上明显的缺陷:吃饭时发出声音会杀死自己
任何动物都有一些不够完美生理结构,即便是人类也不例外。我们可以找到很多人类的“缺陷”,比如人类的奇怪的智齿和阑尾、人类对垃圾食品的偏爱
2024-12-24 00:04:00
撒钱折磨网友的转转 其实自己也不好过
前排声明,差评君的旧手机没放转转上回收,这篇文章也不是转转广告,大伙们可以放心食用。今年小红书,不是把年度词颁布给了抽象嘛
2024-12-24 00:34:00
我屏幕里的二次元萌妹们 开始教高数、打冷兵器、做电焊
虚拟主播大家应该不陌生,指的就是以虚拟形象在视频网站上进行内容创作的主播,通常被称为 Vtuber 、 VUP 。先说个大家肯定熟悉的
2024-12-24 00:34:00
中国电视迎来近年来最好时代
快科技12月23日消息,根据商务部最新数据,截至12月19日24时,已有超过3330万名消费者积极参与了家电以旧换新的活动
2024-12-24 00:34:00
滴滴就用户打到臭车致歉:上线拉黑异味车功能 多地推出“香香车”
快科技12月24日消息,滴滴“臭车”一直以来都是个老大难问题,尤其进入冬季,不少司机减少开窗次数,车内空气质量更是雪上加霜
2024-12-24 00:34:00
天玑8400赋能高阶智能手机市场
2024年12月23日–MediaTek发布天玑84005G全大核智能体AI芯片。天玑8400承袭了天玑旗舰芯片的诸多先进技术
2024-12-24 00:52:00
小米15ultra准备好进军印度市场了吗?
小米15Ultra的全球发布日益临近,最新动态显示其已准备好进军印度市场。新机型号为“25010PN30I”,近日已成功获得印度标准局(BIS)的认证
2024-12-24 01:26:00
华为平板推出智选hi版本,售价1399元起
12月23日,据博主@定焦数码爆料,华为平板也要推出智选Hi版本。实际上,华为智选HiMatePad11.5英寸已经悄然在电商平台上架
2024-12-24 01:40:00
more体验more消息,小米手环10和nfc版入网
据博主@体验more消息,目前有多款国产手环手表入网,其中小米(红米)有两款,型号分别是M2456B1和M2457B1
2024-12-24 01:43:00
小米汽车精英驾驶培训首期课程圆满结束
12月23日,CNMO了解到,小米汽车精英驾驶培训的首期课程圆满结束,官方发布了一段视频,回顾了培训现场令人血脉喷张的体验
2024-12-24 02:18:00
小米hyperos1.4.5上线,新增13项新功能
12月23日,小米汽车推送新版系统XiaomiHyperOS1.4.5,正式引入VLM视觉语言大模型,一口气带来了13项新功能和26项优化
2024-12-24 02:21:00
aocu32u3d,为设计创作人士带来新质生产力
就在双11期间,苹果正式推出了新款Macmini,其采用最新的M4和M4Pro芯片,尺寸仅为手掌大小,尽管厚度略有增加
2024-12-24 03:03:00
免费合规“神器”来袭!企元数智如何引领企业合规新潮?
企业合规之殇,谁来“救赎”?在当今复杂多变的商业环境中,企业合规经营已成为不可逾越的底线与实现长远发展的重要保障。随着法律法规的日益完善和监管力度的不断加强
2024-12-24 03:13:00