• 我的订阅
  • 头条热搜
AI拜年火了,通义千问上线一张照片生成拜年视频
...全民舞王应用也迎来上新,用户可通过一张照片生成拜年视频,用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费“拍”全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...的场景运动建模方法,可用于通过静态图像生成无缝循环视频,还能实现与图像中对象的交互。这项研究来自谷歌,一作谷歌DeepMind研究员Zhengqi Li(李正奇)。最佳学生论文奖也一同公布。一篇BioCLIP: A Vision Foundation Model for the Tr...……更多
AIGC工具测评:生成式AI的产品表现如何
...工具,它们按功能可以划分为:文本生成、图像创作、音视频处理等多个类别。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。一、ChatGPT-4所属公司:OpenAI 发布时...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...lassification)——深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模型各方面已经接近“以假乱真”的效果。但与此同时,大部分视频生成模型的准确程度、遵循指令的能力还...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。 「天工SkyMusic」具有以下五大特点:1. ...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...件的交互方式。未来,AI PC可以直接基于电脑上的照片和视频,直接剪辑生成内容。它也可以作为工作助手,写文档或者提炼总结要点。Meta公布2023年第三季度财报10月25日,Meta公布截至9月30日的2023财年第三财季业绩,第三财季...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...雅在云栖大会展示了“珠峰AI创作服务平台”:珠峰AI音视频创作平台,依托通义文本大模型对文本内容语义的深度理解,打造珠峰AI音频大模型,结合喜马拉雅独有的全品类音色库和数字人大模型,为创作者提供高品质的AIGC音...……更多
AI角色创作平台「捏Ta」完成超千万元融资
...以来,捏Ta的社交媒体曝光量已达到约2.5亿次,多次位列视频号动漫游戏日榜前十。捏Ta在社交媒体上的曝光。图源:看见概念捏Ta团队认为,AIGC技术的发展对图像生产带来的最大改变是,生产资料从原有的像素或图层,变成了...……更多
...提升数据精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平...……更多
我国自研视频大模型面向全球上线
输入文字描述或上传图片,就能生成一段逼真视频。近日,我国自主研发的通用视频大模型Vidu(www.vidu.studio)面向全球正式上线。据悉,这款视频大模型开放文生视频、图生视频两大核心功能,提供4秒和8秒两种时长选择,分...……更多
依图科技“天问”大模型赋能安防,智慧应急跨越式发展
...始研究以Transformer为基础的大模型,并成功将图像感知、视频感知与大模型结合,推动了AI安防技术的跨越式发展。 安防行业,作为社会稳定和公共安全的重要保障,一直是科技创新的先行者。随着AI技术的不断进步,安防行...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...等模型能够根据自然语言提示词生成美观且逼真的图像和视频,广受用户喜爱。然而,这些模型在处理复杂的提示词时仍存在不足。例如,当让Stable Diffusion或Midjourney生成「棕色的狗绕着一棵树追黑色的狗」时,模型可能会错误...……更多
活动回顾|当我们谈论Sora时,我们在谈论什么?
龙年伊始,Sora的发布引发热议,开启视频动画领域的AIGC新篇章。一夜之间, “AI创作”不再只是科技爱好者的美好构想,同时让普通人的AI创作从“文生文”、“文生图”进一步拓展到了“文生视频”。这是否意味着传统广告...……更多
“Sora”王炸,20篇研报带你走进人工智能(下载)
...工智能热潮还在席卷全球,OpenAI又在近日发布了首款文生视频模型“Sora”。人工智能的广泛应用将给人类未来的生产和生活方式带来巨大而深远的影响,并有望作为新的底层通用技术,点燃第四次科技革命!本期三川汇文化产...……更多
大模型到了该「验收」的时候
...AI PPT等新兴应用层出不穷,Sora的火热更是催生了一大批AI视频应用紧锣密鼓地集中亮相。在B端,“百模大战”与“Token价格战”连番上演,实打实地冲开了一片广袤的市场;两年前,GPT 3.5每百万Token的价格约为60美元,而今天,G...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...相关领域的研究,包括多媒体、计算机视觉、模式识别及视频处理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开...……更多
...-1执行任务的成功率就会大幅下降。RT-2通过把互联网上的视频作为辅助训练数据,这在一定程度上提升了模型的泛化能力,但是由于进行数据采集的厨房里桌子的高度是固定的,一旦在真实世界里桌子的高度与训练数据中桌子的...……更多
谷歌发布Gemini,机构看好多模态AI应用商业变现前景,软件ETF(159852)年内份额增长近1.5倍丨ETF观察
...比于单模态,多模态AI能够实现基于文本、语音、图片、视频等多模态数据的综合处理应用,完成跨模态领域任务。中航证券认为,当前大模型应用仍处于技术不断迭代的快速成长初期阶段。未来,各类大模型将具备更强的多模...……更多
CybotStar——大模型一站式应用开发平台
...:CybotStar提供多模态的内容生成能力,包括文本、语音、视频等,帮助产业机构实现文本写作、代码生成、语音生成等基础性功能。 知识库:CybotStar提供了完善的知识库管理系统,支持产业机构高效搭建专属知识库和空间知识...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...据资源,并擅长挖掘数据背后的地理奥秘,甚至能够自动生成专题地图,为地理学研究提供全方位支持。“坤元”通过深度学习320亿词元及4万余条高质量地理学指令,构建了深厚的地理学语言基础。与通用语言大模型相比,它...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...人技术的前沿进展,如基于语音驱动的运动稳定的数字人视频合成,基于显式、隐式记忆增强的语音驱动数字人合成,身份匹配对应学习的高保真人脸驱动,基于解耦潜在运动表征的高保真数字人驱动、高保真音频驱动的歌唱数...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...大模型创新:推出中文原生文生图大模型,突破文字可控生成技术难题;3、全模态技术扩展:新增语音和多模态理解大模型,实现全模态AI技术升级;4、端侧大模型发布:隆重推出3B端侧大模型,能力更强、速度更快、更加安全和...……更多
百度打通两大国民产品!六边形AI创作新物种「自由画布」来了
...式,不论是文本类的doc、pdf、excel,还是多模态图像音频视频类的jpg、mp3/mp4等,自由画布全都支持!并且得益于百度文库和百度网盘的互通,百度网盘中的私域资料可以与百度文库公域资料融合为自由画布提供创作素材。因此搜...……更多
寥寥数语生成60秒视频 Sora能否改变影视行业?
本文转自:解放日报OpenAI发布文生视频大模型引关注寥寥数语生成60秒视频 Sora能否改变影视行业?俞陶然Sora生成的视频截图。扫码看详情 Sora与同类产品相比具有三大优势:60秒时长、单视频包含多角度镜头、遵循部分物理规...……更多
“壹点天玑传媒大模型算法”获国家网信办备案
...监宋耀介绍说,它既可以提供生成热点选题、采访提纲、视频脚本、新闻稿件等常规 “智能创作类”功能,也可以对写好的稿件进行润色优化、标题拟写、摘要提取、智能配图、智能校审、生成跟帖等辅助操作。结合用户需求...……更多
...示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。从技术角度观察,可以用它来做机器的大脑、识别外围的世界、武装未来的自动驾驶,从而使今天的信息系统、模型系统变...……更多
...财联社2月19日电,国泰君安研报指出,OpenAI发布首个文生视频模型Sora,效果震撼。Sora模型可以通过文本描述生成60秒长视频,还可以对视频色彩风格等要素精确理解,创造出人物表情丰富、情感生动的视频内容。Sora三大亮点突...……更多
更多关于社会的资讯:
莱芜农商银行辛兴分理处:跨越千里的暖心守护
鲁网9月24日讯“真是太感谢你们了!我远在石家庄都能感受到家乡的温暖,父亲的银行卡问题解决了,我们全家都安心了。”近日
2025-09-24 10:23:00
□邱爱金王典今年是中国人民抗日战争暨世界反法西斯战争胜利80周年。八十载岁月更迭,沧海桑田,但历史的记忆依然熠熠生辉,民族的精神赓续绵延
2025-09-24 07:38:00
这里不是枯燥的书本式教育,而是发生在你我身边的真实案例;这里不是单向的口头宣传,而是带你沉浸式体验,真切感受各种诈骗手段
2025-09-24 07:52:00
跟着“头号生活玩家”苏东坡,一键卸载内耗| 新刊推荐
你是否有过这样的时刻?明明很努力,却没有收到应有的待遇;明明很谨慎,却一不小心捅出了篓子;明明将一些人和事视若珍宝,却在他人眼中轻如鸿毛……当自己被生活摁在地上时
2025-09-24 06:26:00
【多彩新论】让家风家训成为廉洁文化的“源头活水”
家风家训是涵养廉洁文化的“源头活水”。安顺西秀区本寨村的“四知堂”,东汉名臣杨震“暮夜却金”的故事穿越千年时空,在石头城里回响
2025-09-24 06:46:00
他用热血,让生命“怒放”
本报讯 (全媒体记者邬强、陈春伟) “我想要怒放的生命,就像飞翔在辽阔天空……”近日,在第十一个“世界骨髓捐献者日”主题宣传暨造血干细胞捐献者交流活动现场
2025-09-24 05:52:00
“文润高新 文化课堂”2025年高新区海岸读书会精彩启幕
胶东在线9月19日讯(通讯员 郭健)为营造“书香高新”全民阅读浓厚氛围,深化“文润高新·文化课堂”品牌建设,9月13日
2025-09-24 05:37:00
招远市卫健系统成功举行地震灾害医疗救援综合演练
胶东在线9月19日讯 9月9日上午9时,招远市卫生健康局在招远市人民医院东停车场组织开展地震灾害医疗救援综合演练。此次演练以检验应急响应机制
2025-09-24 05:37:00
教师的故事⑬ | 童心筑童梦,让孩子快乐成长
【编者按】当数字化浪潮席卷课堂,当“双减”政策重塑教育生态,当AI技术叩响未来之门,一批新时代教师正勇立潮头,以青春之姿解锁教育新篇
2025-09-23 21:36:00
医院影像科报告单上出现脏话,市卫健局介入调查,涉事医院发布情况说明
大皖新闻讯 9月22日,有网民发视频称,辽宁省新民市人民医院出具的影像科报告单中竟出现了骂人的脏话,引发热议。23日,记者联系了新民市卫健局
2025-09-23 22:45:00
中国网9月24日讯 据“市说新语”微信公众号消息,为加强直播电商监管,保护广大消费者合法权益,各级市场监管部门依法履职尽责
2025-09-24 00:43:00
今天上午,河南省00后女子黄某醉驾致三人死亡一案开庭审理。受害者董某某母亲代女士表示,事故发生一年来,肇事者未向家属支付任何民事赔偿
2025-09-24 02:04:00
“靠桥吃饭”的好日子来了|世界第一高桥下的创业故事
俗话说“靠山吃山,靠水吃水”,出生在贞丰县平街乡的林国权,怎么也没想到,有一天也能过上“靠桥吃饭”的日子。“快看,这就是即将通车的世界第一高桥
2025-09-23 23:29:00
大皖新闻讯 日前,黄山市统计局发布《2025年1-8月全市经济运行简析》,其中,1-8月,全市景区共接待游客3321.9万人次
2025-09-23 23:53:00
全封闭施工道路!黄山市交警、住建部门加强管控
大皖新闻讯 目前,黄山市中心城区屯溪黎阳龙山路(黎阳学府小区段)道路施工在抓紧进行,虽然该施工路段属全封闭管控,但因施工车辆进出频繁
2025-09-23 22:45:00