• 我的订阅
  • 头条热搜
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...致大模型对机器人执行代码与外部环境不适配,从而降低指令分解能力和执行成功率。同时,云端加载的大模型也会带来时延的问题,制约了基于大模型驱动的多型机器人的域适应能力。若愚科技致力于通用机器人大脑的研究,...……更多
自然语言处理:大模型理论与实践
...自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中的自然语言理解和生成任务,多模态指令微调的数据构造和模型微调方法,以及指令微调优化方法和效果。-...……更多
赋能高质量发展,江苏移动竞逐大模型赛道
...的投入,为客户提供模型全链路的数据准备、模型精调、指令优化、评测部署等服务。”徐奎说。拓展应用场景赋能千行百业“我和好朋友吵架了,很生气,不知道该怎么办。”“我能感受到你现在很生气,吵架后心里肯定不好...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...语音交互中机器声音无法调整的情况,现在只要语音发出指令,就可以控制超拟人在情感、风格、方言、强度等表达方式上做出变化。“用调侃的方式给我说个笑话”、“用东北话给外地朋友介绍下锅包肉”、“说的更快一点”...……更多
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...,这样生成出来的视频会比Sora的效果要好很多;再加上指令遵循,视觉任务就完成了大一统。”在AI应用方面,阶跃星辰看好Agent前景。“追求AGI是我们的初心,我们会坚持基础大模型的研发。”李璟表示,阶跃星辰会坚持进行...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...冻结;在SFT阶段,MLP投影器和LLM都需要训练以学习带有新指令的新视觉-语言任务,且保持视觉编码器冻结。以往文献中很少讨论的是,在多模态SFT训练期间不冻结LLM权重通常会导致纯文本性能显著下降,NVLM-D模型通过整合高质...……更多
...“深数所”)发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段(训练、推理、调优),有的放矢地提供数据源,让国产大模型厂商“寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
vivo6g技术再突破,多款原型机首次亮相
...,并与智能家居系统无缝对接。用户只需通过简单的语音指令,就能轻松控制家居设备,享受智能家居带来的便捷生活。同时,vivo生态产品全面支持Matter协议,这一智能家居通用语言已覆盖五种常用品类,Matter生态中更是有超...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...效压缩视频信息,更充分融合文本和视频内容,贴合用户指令的同时,让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX,它将文本、时间、空间三个维度融合起来,参考了Sora的算法设计。CogVideoX也是一个...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学习的 Isaac Lab 和用于计算编排服...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...对物理世界的理解更好,能够更准确地响应和遵循用户的指令、要求和偏好。这意味着智谱AI画面质量更高、能驾驭的风格更广,可以满足用户对场景、角色、动作、情感等多方的细节期望。如何实现这一点?这离不开智谱全自...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...起来”,向全球展示生动靓丽的“中国名片”。中国AI大模型也首秀世博舞台,科大讯飞代表中国人工智能企业展示了领先的AI大模型技术——依托国产自主可控讯飞星火大模型,打造了支持中、日、英三语实时交互的人工智能...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...户在智能助手中输入“帮我生成一个物料领用管理系统”指令,海岳大模型接收到用户需求后,会通过意图识别将这条“表单开发事件”指令发送到开发大模型。开发大模型识别出这是一条生成指令,便会生成一个用UBML(统一...……更多
AI点外卖还知道怎样省钱!智谱公布Agent三端升级,手机电脑都能被接管
...新进展:手机端方面,AutoGLM新升级,可以理解超长复杂指令,自主执行超过50步的手机操作,还能跨App执行任务,如自主在小红书App检索网友推荐的美食食材后到小象超市下单;浏览器方面,智谱清言网页端插件上线AutoGLM功能...……更多
自主研制!我国发布“全球首个”
...技术大会在山东济南开幕:全球首个百亿级遥感解译基础模型“空天·灵眸”3.0版正式发布;“北斗精准导航与高分遥感综合服务平台”正式发布。全球首个百亿级遥感解译基础模型发布中国科学院空天信息创新研究院科研团队...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。值得注意的是,就在28日深夜,DeepSeek仅凭一己之力就掀翻了美国科技股。截至美股1月27...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...供易于理解的总结 图像生成,构筑个性艺术:根据用户指令创建视觉内容,提供符合个性化需求的定制画面 ……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不仅背景细致,还包含复杂的多角度镜头和富有情感的角色,并根据相应的物理原理在时空上向过去或未来推演。其在演示视频...……更多
行业首家!TCL实业通过国家大模型算法备案
...术的应用,使得TCL+ App智能助手能够更精准地理解用户的指令和需求。通过深入分析大量的IoT云语音交互数据,TCL+ App智能助手成功突破了传统智能助手的局限,具备了多语义设备控制的能力。这意味着用户只需简单的语音指令...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作; 理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。 Qwen2-VL 延续了 ViT 加 Qwen2 的串联结构,三...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...型下了非常复杂的“咒语”,模型依然可以理解你的prompt指令。目前,清影(Ying)API 也同步上线大模型开放平台bigmodel.cn,企业和开发者通过调用API的方式,体验和使用文生视频以及图生视频的模型能力。C端用户则能通过清影...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...阶思维链数据,提升推理思维能力,在数理逻辑、英文、指令跟随等方面能力增强明显,2个多月的时间把基模型的能力提升了30%。未来,商汤科技将继续坚持基础大模型的持续研发与投入,前瞻探索最先进的大模型技术,突破...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...并实现0代码改动。汤雄超称赞摩尔线程的GPU硬件架构、指令集、编译器、MUSA软件栈等设计都非常优秀,清程极智有信心与摩尔线程一起攻克中国AI超大规模训练集群的难题,共同建设世界水平的训练集群。 360集团早在2021年就...……更多
...上市辅导备案,由中金公司担任辅导机构。作为国内“大模型六小虎”中首家启动IPO的企业,智谱AI计划于2025年10月完成辅导,最快2026年登陆A股。你需要知道的国产大模型“六小虎”智谱AI成立于2019年,是中国最早研究大模型...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...版本,可支持128K上下文。别看参数少,1B/3B在总结摘要、指令遵循、重写等任务上,表现非常出色,而且专为Arm处理器做了优化。LeCun激动地表示,「可爱的大羊驼宝宝来了」!Meta首席技术官对Llama 3.2的发布,做了两大亮点总结...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00