• 我的订阅
  • 头条热搜
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
开年“王炸”!智能体再升级,科大讯飞打造办公新范式
...分钟级就能完成初稿。首次发布的全要素创作模式,支持指令、文档与音视频内容等多种类型文件输入;通过采用多模型混合策略,智文能够智能规划生成路径,不同场景自动选择最优模型,让用户能够根据自身需求实现内容的...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...性能超过GPT5、Claude Opus 4等,跻身全球前三。Qwen3-Max包括指令(Instruct)和推理(Thinking)两大版本,其预览版已在 Chatbot Arena 排行榜上位列第三,正式版性能可望再度实现突破。Qwen3-Max是通义千问家族中最大、最强的基础模型,...……更多
华语区AI新标杆,夸克凭“AI超级框”蝉联四地App Store冠军
...边界的“AI超级框”。用户可以在“AI超级框”执行复杂指令,进行深度思考,完成AI搜索、AI写作、AI生图、学术搜索、AI搜题、文件总结等不同场景下的各类任务。 ……更多
...工作人员通过华藏输入“帮我生成一张万里长城的照片”指令,华藏即时给出了相应的图片。而当他继续提出“把万里长城变成雪景”指令时,华藏可以根据上下文语境,对图片进行相应指令的修改——万里长城瞬间平添皑皑雪...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...致大模型对机器人执行代码与外部环境不适配,从而降低指令分解能力和执行成功率。同时,云端加载的大模型也会带来时延的问题,制约了基于大模型驱动的多型机器人的域适应能力。若愚科技致力于通用机器人大脑的研究,...……更多
自然语言处理:大模型理论与实践
...自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中的自然语言理解和生成任务,多模态指令微调的数据构造和模型微调方法,以及指令微调优化方法和效果。-...……更多
赋能高质量发展,江苏移动竞逐大模型赛道
...的投入,为客户提供模型全链路的数据准备、模型精调、指令优化、评测部署等服务。”徐奎说。拓展应用场景赋能千行百业“我和好朋友吵架了,很生气,不知道该怎么办。”“我能感受到你现在很生气,吵架后心里肯定不好...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...,这样生成出来的视频会比Sora的效果要好很多;再加上指令遵循,视觉任务就完成了大一统。”在AI应用方面,阶跃星辰看好Agent前景。“追求AGI是我们的初心,我们会坚持基础大模型的研发。”李璟表示,阶跃星辰会坚持进行...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...冻结;在SFT阶段,MLP投影器和LLM都需要训练以学习带有新指令的新视觉-语言任务,且保持视觉编码器冻结。以往文献中很少讨论的是,在多模态SFT训练期间不冻结LLM权重通常会导致纯文本性能显著下降,NVLM-D模型通过整合高质...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
vivo6g技术再突破,多款原型机首次亮相
...,并与智能家居系统无缝对接。用户只需通过简单的语音指令,就能轻松控制家居设备,享受智能家居带来的便捷生活。同时,vivo生态产品全面支持Matter协议,这一智能家居通用语言已覆盖五种常用品类,Matter生态中更是有超...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...效压缩视频信息,更充分融合文本和视频内容,贴合用户指令的同时,让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX,它将文本、时间、空间三个维度融合起来,参考了Sora的算法设计。CogVideoX也是一个...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编排服...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...对物理世界的理解更好,能够更准确地响应和遵循用户的指令、要求和偏好。这意味着智谱AI画面质量更高、能驾驭的风格更广,可以满足用户对场景、角色、动作、情感等多方的细节期望。如何实现这一点?这离不开智谱全自...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...起来”,向全球展示生动靓丽的“中国名片”。中国AI大模型也首秀世博舞台,科大讯飞代表中国人工智能企业展示了领先的AI大模型技术——依托国产自主可控讯飞星火大模型,打造了支持中、日、英三语实时交互的人工智能...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...户在智能助手中输入“帮我生成一个物料领用管理系统”指令,海岳大模型接收到用户需求后,会通过意图识别将这条“表单开发事件”指令发送到开发大模型。开发大模型识别出这是一条生成指令,便会生成一个用UBML(统一...……更多
“百模大战”,国产 GPT 大全
...天机器人。经过大致统计,目前主要有22家公司开发的大模型相对成熟,从应用方向来看,主要分为“通用型”和“专业型”。通用型文心一言Baidu 旗下的“文心一言”是基于飞桨深度学习平台和文心知识增强大模型。能够与人...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...新进展:手机端方面,AutoGLM新升级,可以理解超长复杂指令,自主执行超过50步的手机操作,还能跨App执行任务,如自主在小红书App检索网友推荐的美食食材后到小象超市下单;浏览器方面,智谱清言网页端插件上线AutoGLM功能...……更多
自主研制!我国发布“全球首个”
...技术大会在山东济南开幕:全球首个百亿级遥感解译基础模型“空天·灵眸”3.0版正式发布;“北斗精准导航与高分遥感综合服务平台”正式发布。全球首个百亿级遥感解译基础模型发布中国科学院空天信息创新研究院科研团队...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。值得注意的是,就在28日深夜,DeepSeek仅凭一己之力就掀翻了美国科技股。截至美股1月27...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...供易于理解的总结 图像生成,构筑个性艺术:根据用户指令创建视觉内容,提供符合个性化需求的定制画面 ……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不仅背景细致,还包含复杂的多角度镜头和富有情感的角色,并根据相应的物理原理在时空上向过去或未来推演。其在演示视频...……更多
行业首家!TCL实业通过国家大模型算法备案
...术的应用,使得TCL+ App智能助手能够更精准地理解用户的指令和需求。通过深入分析大量的IoT云语音交互数据,TCL+ App智能助手成功突破了传统智能助手的局限,具备了多语义设备控制的能力。这意味着用户只需简单的语音指令...……更多
更多关于科技的资讯:
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00
从优篮子到 JOBY:唯迹科技的全球化成长之路
在摄影配件行业,“速生速死” 是常态 —— 产品迭代快、价格战频发,多数企业陷入内卷困境。而深圳市唯迹科技有限公司却走出了一条 “反常识” 的发展路径
2025-09-26 12:07:00
让AI规划假期行程,告别烧脑做攻略比价;戴上耳机,和自己的专属AI讲解员一起边逛边聊,拍展品听讲解,拍景点听典故,拍建筑听历史……这种全新的旅行体验
2025-09-26 12:08:00