• 我的订阅
  • 头条热搜
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更加安全和...……更多
“壹点天玑传媒大模型算法”获国家网信办备案
...监宋耀介绍说,它既可以提供生成热点选题、采访提纲、视频脚本、新闻稿件等常规 “智能创作类”功能,也可以对写好的稿件进行润色优化、标题拟写、摘要提取、智能配图、智能校审、生成跟帖等辅助操作。结合用户需求...……更多
...示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶,从而使今天的信息系统、模型系统变...……更多
...财联社2月19日电,国泰君安研报指出,OpenAI发布首个文生视频模型Sora,效果震撼。Sora模型可以通过文本描述生成60秒长视频,还可以对视频色彩风格等要素精确理解,创造出人物表情丰富、情感生动的视频内容。Sora三大亮点突...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...I技术的广泛落地。6.首提时空架构,谷歌爆肝7个月祭出AI视频大模型Lumiere谷歌经过7个月的密集研发,推出了名为Lumiere的AI视频大模型,与传统的AI视频生成模型不同,Lumiere能够在一个连贯的过程中生成整个视频,显著提升视频...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.SZ)旗下天幕大模型开启公测。据万兴科技此前介...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。 以视觉问答为例,该框架会基于问题和图片生成查询关键词,并调用搜索引擎查找相关信息,再由粗到细地对检索结果进行过...……更多
AI智能体引擎加持:天玑9400让「完全体」AI手机提前问世了
...,终于迎来了一次能力突破。今年刷爆整个科技圈的 AI 视频生成,不打招呼就落地到了手机上。很多大厂还在邀请测试中的 AI 短视频生成能力,现在用手机算力就可以本地搞定了。大模型的训练,现在也可以在端侧完成:勾选...……更多
王炸级3nm安卓AI芯片发布,生成视频不用联网
...侧DiT架构支持,无需联网就能在手机上体验Sora同款架构视频生成。【视频请移步公众号】还有业界首发的端侧LoRA训练,可以高效离线训练专属于自己的LoRA生图模型,同时保证隐私不泄露。大模型方面,天玑9400能够运行的模型...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...OpenAI的GPT-3.5更强大。苹果也正在试验Siri增强功能、生成视频和图像的软件,以及处理图像、视频和文本的多模式人工智能技术。此前,由于苹果一直比竞争对手更加谨慎,将隐私置于功能之上,导致Siri落后于Alexa、Google Assistan...……更多
文心大模型4.0发布!李彦宏:相比GPT-4毫不逊色
...,迅速生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一系列能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。同时,他还通过解数学题、总结知识点等场景,展示了大...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...发布中,Gemini终于揭开了面纱——展现了其文本、图像、视频、音频和代码的五大能力,一口气推出了大中小三个版本,从云上到手机、平板都可以跑。并且,Gemini还有大量的酷炫用例:AI对一段视频可以做出准确反应,AI能和...……更多
WAIC 2024观察 | 大模型需要颠覆性应用,必然是技术与产业积累的结合
...、大批量、高精准的用户对话交互。京东超市通过言犀AI视频外呼技术,让代言人张若昀为用户送上生日祝福。对比普通语音外呼,转化率提升70%以上,GMV提升290%以上。此外,视频外呼还可结合言犀数字人短视频技术,自动化、...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...的突破?2024年2月16日凌晨,OpenAI在官网发布了最新的文生视频模型Sora。Sora不仅突破了现有文生视频模型10秒左右的连贯性局限,而且展示出了更精细的画质、多角度多镜头切换中保持一致性等能力。最重要的是,Sora较好地表现...……更多
火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
...背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智能(AGI,General Artificial Intelligence)的追求——这一点也一直是他们的研究主线和研究理想,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...oyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab依托北京大学视频与视觉技术国家工程研究中心和多媒体信息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研...……更多
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决...……更多
...信达证券指出,受益于全球生成式 AI 持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效。多家A股公司披露视频生成模型领域的业务情况据不完全统计,包括万兴科技、博汇科技、当虹...……更多
OpenAI CEO又创办了一家AI健康公司
...基础模型升级,新增首尾帧控制和镜头控制等功能,文生视频开放到10秒,同时可图开源。快手拥有包括可灵、可图、快意等在内的大模型矩阵,并搭建了数字人全流程AIGC服务,还在APP评论区上线了智能体“AI小快”。快手坚持...……更多
生成式人工智能新时代
...角。 生成式AI是什么?张亚林介绍,文本、音频、图像、视频、游戏生成,跨模态、多模态的生成,虚拟人的生成等,都可以通过各种素材的生成进行互换,这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发...……更多
鑫闻界|Sora概念行情逐渐分化,谁是真热,谁是虚火?
记者 黄寿赓2月16日,OpenAI发布首个文生视频模型Sora,可快速制作长达一分钟的视频,由此引爆A股Sora概念,据同花顺数据,截至2月21日收盘,Sora概念累计涨幅达35.57%,安诺其、因赛集团等录得连板。概念“三连阳”的同时,个...……更多
...成能力;(2)消费图片的生成和自动化修改能力;(3)视频内容自动生成及剪辑能力;(4)多模态输入理解能力;(5)从多模态中提炼情感倾向能力等。 ……更多
华为harmonyosnext重塑全新“星盾”安全架构
...实现了质的飞跃。它不仅能够更精准地理解文本、图片、视频等传统模态,还能处理雷达、红外、遥感等新型模态数据,为物理世界的数字化呈现提供了更丰富的视角。在内容生成方面,盘古5.0能够生成符合物理世界规律的多模...……更多
百融云创荣获“2024大模型创新应用奖”
...环节中沉淀下大量数据,涵盖文本、表格、图片、音频和视频等多模态格式。知识库可以说是企业的“独家配方”,具有机密性、专业性和规模化的特点。知识库不仅是大模型发挥能力的核心“语料”,更是大模型真正在产业发...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...多个实际场景中得到应用。例如,在游戏中为 NPC 配音,视频创作中进行方言配音等。通过这一技术,游戏和视频内容能够更加贴近地域文化,提升用户的沉浸感和体验感。未来,随着端到端语音交互大模型的进一步发展,这项...……更多
商汤徐立内部信:生成式大模型AI的普及和商业化需要降低生产和使用成本
...随着尺度定律(Scaling Law)在大语言模型、多模态模型、视频生成模型以及慢思考推理过程中得到验证,生产和使用大模型的成本可以直接等价于算力资源的消耗。简言之,生成式大模型AI的普及和商业化,需致力于降低大模型...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...超过70万次,在线可用的演示程序也已帮助用户在图像和视频数据中分割了数十万个物体,并且在跨学科(包括医学图像、气象学等研究)中产生了巨大的影响。 本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重,性能更强。...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...而更长的上下文使模型处理的信息更多,例如长文档、长视频,这种能力同样为更多现实世界的应用程序提供了所需的功能。然而,目前面临的问题是一些工作已经启用了长上下文视觉语言模型(VLM),但通常是采用简化的方法...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...技术的发展方向。正如互联网时代从文字到图片、语音、视频的创作方式演变,未来AI时代人类与大模型的交互也一定不会局限于文字。借助“中文逍遥”大模型,中文创作者将更早获得无边界思想盛宴的快乐。任何作者都希望...……更多
更多关于科技的资讯:
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00