• 我的订阅
  • 头条热搜
...有重要的意义。国际传播领域的变革者Sora能够自动生成高质量的视频、图像内容,不论是在工具效能提升、传播效果争夺,还是在传媒生态构建等方面都重塑了智媒时代国际传播新样貌。一是让传播手段更加立体。热闹前行的...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...达到 750 亿参数,性能获得了大幅升级。AInno-75B 增加了多模态处理能力,支持输入文本、图像、视频以及工业场景中的行为(Action)模态,如 CAD 等。通过引入高参数量大模型 AInno-75B, 创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...k-13B)模型。该模型为130亿参数,经过3万亿以上tokens海量高质量数据集上进行预训练,具备聊天、问答、文本提取、数据分析和代码生成等功能。星火开源大模型 同时,科大讯飞也基于星火V3.5的大模型能力,全线升级了翻译机...……更多
...寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由37家不同的数据商提供,涵盖12个“数据要素×”领域,3家境外数据商,7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。且本批数据...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...易。以往的研究,如 GenSAM [1],提出利用 LLaVA/BLIP2 这类多模态大模型(MLLMs)来推理出特定样本的分割提示,以指导分割过程。然而,这种方法在处理像伪装样本分割这样的场景时,往往因为目标共现偏差(object co-occasion bias)...……更多
人工智能迭代速度超乎想象,对教育有何影响?
...们认为很难解决的问题,但与大模型结合后,就可以得到高质量完成。”梁正表示当前的生成式人工智能已经具有理解能力,可以根据提示词和情境生成内容,发展迭代速度超乎想象。“如果说,2023年是AI年,那么2024年可能就...……更多
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
...难; 室内外场景、不同光照条件下的多样性。为了获得高质量的标注,应对真实视频带来的挑战,研究团队建立了一套可靠的标注系统:识别并标注相机参数变化的关键帧,确保片段内的一致性; 结合2D-3D对应点和RANSAC算法进...……更多
聚焦2024数博会|AI助力多彩贵州新未来,讯飞星火V4.0亮相2024数博会
8月28日,以“数智共生:开创数字经济高质量发展新未来”为年度主题的2024中国国际大数据产业博览会(以下简称“2024数博会”)在贵阳开幕。在专业展馆中,科大讯飞以“懂你的AI助手”为参展主题,携讯飞星火大模型V4.0及...……更多
华为云盘古大模型5.0发布:可控时空生成技术重塑自动驾驶开发
...,其创新的多模态生成能力,可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示,盘古5.0通过创新的可控时空生成,大规模的生成和实际场景相一致的驾驶视频数据,有机会重塑自动驾驶的开发...……更多
AI画家的「滑铁卢」:为什么冰可乐不愿意住进茶杯里?
...了为 “茶杯” 分配的采样步数。于是,我们使用一个多模态模型来衡量图像与茶杯以及冰可乐的契合度评分。当图像和两个概念的评分之间相差很大时,说明有一个概念很可能被模型忽略了,于是就需要相应地调整 N 的取值。...……更多
创新典范:联通元景大模型再获三项殊荣
...发挥联通元景大模型多模态、语义理解和推理能力,构建高质量文本语义表征,以不同历史朝代文物为原型与基本素材,着力挖掘文物元素及艺术特质,实现文创设计辅助。同时还能够准确理解提示词中关于人物形象、古代服饰、文...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...WPS AI可为用户提供包括语义检查、内容改写、文档润色和一键生成PPT等功能。据张宁介绍,在应用生成式AI技术之前,WPS只能针对单个单词进行拼写检查,无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic C...……更多
ECCV 2024 | 南洋理工三维数字人生成新范式:结构扩散模型
...Feedforward 3D Generative Model),相比于已有 3D GAN 方法可生成高质量、多样化且视角一致的三维数字人,并支持不同层级的可控生成与编辑功能,如局部服装编辑、三维虚拟试衣等部位感知的编辑任务,且不依赖于特定的服装类型或...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...问答等任务“信手拈来”。基于此,科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文,这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...器”,帮助用户以极低的门槛创建专属AI智能体,并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普遍视为腾讯版的“GPTs”。今年1月,OpenAI发布GPTs时,市场曾一度将其视为人工智能领域的“iPhone时刻”,有望帮助大模型...……更多
「一键脱衣」的 AI,连孩子都不放过
...事的男生,将女同学发在社交媒体的照片上传到了一款「一键脱衣」AI 工具。 ▲ 他们所用的 AI 工具.这款工具可以通过手机 app 或者即时通讯软件 Telegram 使用,口号是「免费脱掉任何人的衣服」,只要别人有照片落在你的手机...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...习并模拟自然界中的扩散过程来合成新数据,尤其在生成高质量逼真图像方面相较于其他模型架构具有显著优势。因此,尽管近年来也有基于 GPT 等其它架构的优秀图像、视频生成模型不断涌现,基于扩散模型的架构依然是当前...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭...……更多
Sora这就落伍了?Meta“最强视频模型”不用DiT,用Llama大力出奇迹了
...频生成: Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐,而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒,而且Meta还表示,它们的音频模型可以生成任意长度视频的连贯音频...……更多
Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤
...。Sora如果实现大规模推广,将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍,Sora应用的技术与此前的深度伪造技术相互承接,又有所不同。深度伪造技术引起公众注意是...……更多
本周(4.8-4.14)AI界发生了什么?
...源:论文论文链接:AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息,马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外,Grok现在可以处理各种各样的视觉信息,包括文档、图表、图表、屏幕截图...……更多
今年 WISE大会的“AIGC”含量有多高?超有料揭秘提前看
...基于行业需求的生产力布局,为音乐产业的数字化升级和高质量发展注入新的活力。WISE2023专题页接入生成式AI产品“文心一言”2023年10月,百度文心大模型4.0版本正式发布,相较文心一言线上版本在理解、生成、逻辑和记忆四...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...测的轨迹渲染点云,并利用ViewCrafter根据渲染的点云生成高质量的新视角。随后利用生成的新视角更新点云,以扩展全局点云表征。通过迭代执行这些步骤,最终可以获得覆盖大视场范围和扩展点云的高保真新视图,并支持高斯...……更多
...,加快推动人工智能发展、培育新质生产力,不仅是科技高质量发展的必然要求,同时也是特斯联矢志不渝的内在研发动力。过往八年,通过将人工智能技术与实际场景结合并持续落地,特斯联积累了宝贵的实践经验,并交付了...……更多
AI为数字办公按下“加速键”
...新制定国家标准和行业标准50项以上,推动人工智能产业高质量发展的标准体系加快形成。近年来,随着人工智能大模型技术的涌现,中国各行各业纷纷入场,数字办公行业是其中之一。人工智能产业迎来新一轮发展热潮的背景...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
全球AI大事记·疯狂三月盘点:9万亿AIGC时代即将到来|钛媒体AGI
...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...笔!正如其名字一样,Sana能以惊人速度合成高分辨率、高质量,且具有强文本-图像对其能力的模型。而且,它还能高效生成高达4096×4096像素的图像。项目主页:https://nvlabs.github.io/Sana/论文地址:https://arxiv.org/abs/2410.10629……更多
迎着应用爆发的曙光,百度将推出新版文心大模型
...,张冠李戴的幻觉现象普遍存在,这也是为什么今天的多模态大模型还没有什么成规模应用跑出来的原因。今年年初时,在整个中文互联网都为Sora而捶胸顿足的时候,百度决定解决图像生成的幻觉问题。百度最新发布的检索增...……更多
...索与实践,不断攻克技术难题,以先进技术助力金融行业高质量发展。 ……更多
更多关于科技的资讯:
厦门半导体显示产业孵化器揭牌
天马微电子已在厦建设5条先进生产线,助推厦门形成主流显示技术全覆盖的布局。图为参会代表参观天马微电子的展出产品。(厦门日报记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)打造新型显示产业高地
2025-12-11 08:18:00
Meta使用阿里千问优化其最新AI模型
12月10日晚间消息,据彭博社报道,美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴Qwen模型进行蒸馏优化
2025-12-11 08:34:00
当iPhone屏幕突然冻结在苹果标志上无法启动,或是在系统更新后陷入无限重启的循环,很多用户的第一反应是连接电脑使用iTunes恢复
2025-12-11 08:38:00
鲁网12月9日讯深耕新能源与电力装备产业20余年的制造业单项冠军企业——特锐德集团,顺应国家“双碳”战略与产业转型升级需求
2025-12-11 08:39:00
近日,华夏基金旗下股权投资平台——华夏股权宣布完成对杭州云深处科技的联合领投。此次投资不仅是华夏股权在机器人及智能装备产业链的关键战略布局
2025-12-11 09:42:00
纵览宠粉计划丨集福卡赢好礼!纵览新闻宠粉活动放大招啦~
纵览宠粉计划第四轮来啦!12月11日至18日福利拉满集齐八张福卡超多好礼带回家点击上图直达活动不管你是纵览的老粉还是刚加入的新朋友这场专属活动千万别错过在前两场活动广受欢迎的演出票
2025-12-11 09:48:00
近日,记者调查发现,美颜生鲜灯并未完全退出市场,而是以隐蔽姿态继续“发光”。在沿街商铺、小区周边门店内,有不少商家使用明令禁止的红罩红光生鲜灯
2025-12-11 09:53:00
以时光炼技能,以热爱赴荣光:华润万家第二届“万家工匠”全国技能大赛总决赛颁奖典礼温暖落幕
聚光灯照亮领奖台,掌声致敬每一份坚守,12月8日下午,第二届“万家工匠”全国技能大赛总决赛颁奖典礼圆满落幕。历经赛场的激烈角逐与专业的层层考量
2025-12-11 10:51:00
在心理健康日益受到全社会重视的背景下,广州勤圣伊科技有限公司(以下简称“勤圣伊科技”)凭借其“科技融合专业”的创新模式
2025-12-11 11:02:00
近日,专注于心理健康领域的广州勤圣亦科技有限公司(以下简称“勤圣亦科技”)宣布,其通过“科技+专业服务”的创新模式,在心理咨询服务数字化与普惠化方面取得显著进展
2025-12-11 11:04:00
12月9日,云深处科技宣布完成超5亿元人民币C轮融资。本轮融资由招银国际和华夏基金联合领投,中国电信、中国联通旗下基金参与战略投资
2025-12-11 11:15:00
以融资租赁之力,赋能产业升级 ——2025 PA“租赁节”拉开帷幕
2025年是“十四五”规划收官之年,我国产业结构转型进入深化攻坚阶段,融资租赁作为服务实体经济、产业转型升级中的重要力量
2025-12-11 11:22:00
依靠学习 走向未来——好书推荐书单:以书为帆 智行致远
01、《电动中国》作者:杨旭东、黄郑出版社:新华出版社书中将中国新能源科技发展置于能源革命与国际竞争的双重视角下,分析动力电池
2025-12-11 12:43:00
近年来,AI驱动的修复视频清晰度软件逐渐普及,无论是老旧的VHS录像、噪点明显的夜间视频,还是压缩导致的画质损失,都有机会被修复
2025-12-11 11:06:00
二手平台价格水涨船高 便利带来隐私权限风险商报讯 今年最火的行业是什么?无疑就是AI。现在不仅仅是下载AI App
2025-12-11 11:46:00