• 我的订阅
  • 头条热搜
...元化。三是传播内容生成更加迅捷。目前,Sora根据文字指令创作出的视频,包含多角度镜头,不仅能够生成具有连贯性的场景,还能够模拟复杂的场景和角色表情,极大提升了信息内容采集的效率和质量。此外,利用大数据分...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
...技术,将带来三方面风险。张亚勤简要总结了人工智能大模型的发展趋势:一是多模态、多尺度、跨模态的新智能;二是未来五年要在整个架构上有大的突破,追随尺度定律(Scaling Law),但未必是transformer模型结构;三是智能逐渐...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...“AIGC第一股”出门问问(02438.HK)携AIGC艺术展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为...……更多
蚂蚁数科SOFAStack发布全栈AI服务,助力企业用好大模型
6月28日,伴随大模型落地从通用技术进步逐步迈向行业可用,蚂蚁数科旗下多云PaaS平台SOFAStack正式发布大模型服务平台AI Max。该平台兼容适配主流开源大模型、国产算力,向企业提供进行模型训练、部署、评估、优化等一站式...……更多
京港洽谈会海淀专场圆满落幕,智谱积极响应共绘两地合作蓝图
...谱的技术成果。智谱深耕人工智能多年,不仅在千亿基座模型、对话模型、代码模型、多模态模型等关键领域完成了全面布局,更在推动技术成果转化、服务产业升级方面展现了强大实力。智谱以全自研基座大模型为基础,研发...……更多
百度世界2023剧透丨百度将发布国内首个生成式商业智能产品
...杂系统一步直达;在智能文档处理场景中,超级助理根据指令,快速找出相关文档,知识获取效率倍增,还能在浏览器Web端快速查阅、总结、翻译文献资料;在高频沟通场景,“IM智能总结”和“AI会议洞察”“AI会议纪要”可以...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...背景下,如何评估这些模型在多轮对话和多语言环境下的指令遵循(instruction following)能力,成为一个重要的研究方向。现有评估基准多集中于单轮对话和单语言任务,难以揭示复杂场景中的模型表现。最近,Meta GenAI团队发布...……更多
GPT-4o:“更像人”的人工智能模型
...开始或打断对话,识别说话人的语气、情绪,根据场景或指令生成多种音调、带有丰富人类情绪特征的音频回复,你甚至可以要求它唱歌。 GPT-4o-视觉能力大大提升。它可以查看不同语言的菜单照片并进行翻译,还能在传统识图...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...议为例,基于混元的AI小助手上线后,用户只需要简单的指令,就可以完成发言提醒、观点总结、会议纪要等能力,大幅度提升会议效率,且过去四个月,用户日调用量增长了20倍。在大模型落地的过程之中,场景选择、需求匹...……更多
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...息基础设施管理处及人工智能发展处处长潘焱表示,以大模型为代表的生成式人工智能等前沿技术加速迭代,与社会生产的各个领域融合成为全球经济发展的强劲动力。面向未来,上海将与海内外企业进一步强化跨学科的研究和...……更多
苹果展示ferret-uiai系统可理解应用程序
...和小部件列表。这些样本的格式都是按照带有区域注释的指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相...……更多
Sora为何没能诞生在中国?
...家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布...……更多
WAIC 2024观察 | 大模型需要颠覆性应用,必然是技术与产业积累的结合
...入第七个年头。京东云在WAIC2024上全景式展示了京东在大模型与AIGC领域的布局,包括业内首创的企业家数字人直播模式,以及大模型在政务、健康、零售等多场景的落地应用和产业实践。大模型深度应用于京东场景自去年7月,...……更多
...机器人,以自研的双芯双目架构及“逍遥AI”人工智能大模型全面革新了扫拖机器人的导航避障能力,可通过AI视觉技术主动识别固液脏污,从而实现干湿分离清洁。同时,新品搭载的云鲸多模态大模型NarGPT大幅提升了语音助手...……更多
...多种应用场景,亮点颇多,引人关注。前沿趋势馆 “大模型”一次看个够前沿趋势馆以“数字技术—数字服务—数字产品”为主线,将重点展示大语言、视觉、生物、多模态等各类人工智能大模型、Web3.0等数字技术领域的前沿...……更多
AI顶会自动驾驶挑战赛:无图小米汽车 全球第二
...enge)。今年挑战赛共设置了7个赛道:端到端自动驾驶世界模型占用网络与光流的运动预测具身智能多模态3D视觉定位CARLA自动驾驶挑战LLM在自动驾驶的应用无图自动驾驶CVPR主办方介绍说,LLM与世界模型的出现,给自动驾驶带来巨...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMin...……更多
既要又要的年轻人,为何偏对全屋智能如此上心?
...心术等创新功能,如AI氛围师,可以通过用户发出的简单指令,构建出能够营造氛围的方案,对灯光、音乐、影像、温湿度等多设备进行联动,为用户营造整体氛围效果。再如小度读心术,则是可以通过对用户习惯的不断记忆和...……更多
国君策略:北交所行情降温,资金回流拥抱产业新变化,关注四大主题
...了旗下第一款AIGC应用产品Pika1.0。此款产品不仅能够按照指令生产和编辑3D动画、动漫、卡通和电影,还可以实现对现有视频素材中的元素进行修改和替换。公司发布的宣传视频颠覆了市场对于传统视频制作的认知,极大拓展了...……更多
AI手机看荣耀:荣耀MagicOS 9.0发布 开启手机自动驾驶新时代
...求。比如,“一句话点咖啡”,用户只需向YOYO发出语音指令“帮我点一杯热拿铁”,YOYO在理解用户需求后,就会像人一样调取用户经常使用的外卖APP,找到经常光顾的咖啡店,自动完成点咖啡操作,并向用户确认结算,完成点...……更多
Gemini引领多模态AI热潮,产业发展有望加速
...涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规模最大、能力最强的AI多模态模型,它将给整个广告营销行业带来巨大变化。AI产业发展迎来里程碑Gemini1.0具有原生多模态的能...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
12月6日夜间,谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台,在公开信中将Gemini描述为:“我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...再次刷新端侧多模态天花板,面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新!仅8B参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」:小钢炮...……更多
“大模型+汽车”乘势而起,科大讯飞星火座舱荣获这项特别奖
...可以深度理解用户的各类语言内容,包括自由聊天、复合指令、知识类问答;同时大模型能够调用复杂的知识功能库,以超拟人的语音合成能力,解答、解决用户用车中的各类情景问题,实现远胜于传统语音助手的智能体验!1...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
国产大模型第一梯队玩家,为什么pick了CPU?
...个时钟周期可完成高达2048个INT8运算,比上一代AVX512_VNNI指令提升8倍之多。更重要的是,英特尔®AMX加速器是内置在CPU核心里的,让矩阵存储和运算更近,这一特性应用在大模型推理上,能够降低处理下一个Token的时延,让终端用...……更多
人形机器人进厂“实习”,汽车制造还需要工人吗?
...觉语言模型加持下,能和人类进行语言交互,并自主完成指令动作。整个过程中,OpenAI的大模型负责视觉推理和语言理解,而Figure AI的神经网络处理快速灵巧的机器人动作。Figure01实现与人类语言交互,来源:视频截图据该公司A...……更多
理想发布史上最大更新:「理想老师」能写会画,无人泊车即将推送
...感知的帮助下,可以识别「打开这个」、「打开那个」的指令。说得更具体一点,如今的理想同学,能够通过驾驶员头部向右偏转的角度,判断出驾驶员到底是在给理想同学下达指令,还是在与副驾交谈。这只是理想同学本次更...……更多
更多关于科技的资讯:
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00
数字游民在南京:我推着房间找邻居
随时“云端”办公,自由“安放”工位,数字游民社区兴起数字游民在南京:我推着房间找邻居南京首个乡村数字游民社区坐落于浦口草圣书乡景区
2025-09-26 08:14:00
三迭纪项目入选国家药监局智慧监管典型案例年产3亿片!3D打印药片,片片皆可溯源南报网讯(通讯员唐斐记者张希)近日,国家药品监督管理局信息中心正式公布“2025年药品智慧监管典型案例”
2025-09-26 08:14:00
二〇二五年中国香料香精化妆品精品博览会启幕十七个香妆产业创新转化项目签约南报网讯(记者夏思宇)9月25日上午,2025年中国香料香精化妆品精品博览会在南京扬子江国际会议中心开幕
2025-09-26 08:15:00
厦门网讯(厦门日报通讯员 李汶鸿)24日,在上海市普陀区普熙金融广场PUSH艺术中心举办的“数字人民币国际运营中心业务平台推介会”上
2025-09-26 08:38:00
在智能语音机器人赛道,技术稳定性与迭代能力是核心竞争力,神州泰岳旗下鼎富智能avavox大模型语音机器人依托两大技术优势
2025-09-26 08:52:00
服务升级,烟台联通创新推出急救知识培训增值服务
近日,烟台联通在客户日活动中面向VIP客户创新开展急救知识培训公益增值服务,邀请中国红十字会专业急救讲师现场授课,通过“理论+实操”相结合的方式
2025-09-26 09:24:00
中交一公局集团建筑公司武清城改项目QC成果斩获省部级二等成果奖
近日,由中交一公局集团建筑公司武清城改项目申报的《BIM+智能设备在大型城中村改造项目施工阶段的应用》凭借在特大型群体住宅工程的应用实践
2025-09-26 10:49:00
中新经纬9月26日电 9月25日,小米集团创始人、董事长兼CEO雷军在年度演讲上回顾了小米汽车造车历程。雷军提到,今年6月
2025-09-26 10:54:00
与邻一起 共建美好社区!我爱我家首届社区好邻节启幕
近日,头部房产经纪企业我爱我家正式启动主题为“好邻·好礼·好生活”的2025我爱我家社区好邻节。据介绍,本次活动从9月22日至10月31日
2025-09-26 11:24:00
小米汽车推出独特定制服务:试运营一年,每月最多定制40台
9月25日,小米公司创始人雷军在年度演讲中宣布推出一项独特的服务——小米定制服务。雷军表示,小米YU7是为一群高审美,无法容忍平庸的人设计的
2025-09-26 11:37:00
解放双手!小米推出首款三区洗衣机,衣服、内衣、袜子各占一个筒
9月25日,在年度演讲暨秋季新品发布会上, 小米推出了首款三区洗衣机——米家三区洗衣机Pro 滚筒10kg,售价3999元
2025-09-26 11:38:00
机构:鸿蒙电脑占高端市场份额超70%
华为鸿蒙折叠电脑MateBook Fold非凡大师的上市成为改写高端笔记本市场格局的关键事件。根据GFK 2025年6月统计
2025-09-26 11:38:00
补链强基 延链拓新——济南历城绘就产业发展新图景
鲁网9月26日讯(记者 李晓晨)从算力之巅的超级计算中心到家庭智能的创新终端,从芯片封装的关键环节到水处理技术的自主研发
2025-09-26 12:03:00