• 我的订阅
  • 头条热搜
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...智能)正掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者。李彦宏表示,百度作为一家技术公司,定位是尽可能为大家提供所需的开发工具,这包括了1个基础模型系列和三大AI开发工具,“今天的...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...展、通用大模型「序列猴子」及其AIGC产品矩阵,包括AI短视频创作平台「元创岛」、AI数字分身「奇妙元」、AI配音助理「魔音工坊」、AI数字员工「奇妙问」等多个AI应用亮相展会,为现场观众带来一场零距离、沉浸式的AIGC探索...……更多
...。北京时间2月16日凌晨,Open AI公司正式发布其首个文本-视频生成模型Sora。Sora文生视频功能强大,能够通过文本提示生成长达1分钟的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。同时,Sora还...……更多
AI潮起 共筑数智之基
...速实现从传统信息服务到智能服务全面升级,中国移动对视频彩铃、5G新通话、移动云盘、移动高清、云电脑等20余款战略产品开展全量AI+升级,通过全面接入人工智能大模型,实现产品的功能重塑、流程重构、机制重建,全面...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...的语音合成效果。其首批40个语种平均MOS分(评估音频或视频质量的一种标准,5分为最高)提升了0.25,拟人测试中MOS达到4.5分,拟人度达到83%,拟人语音合成能力超越ChatGPT。星火语音大模型开源方向上,此次科大讯飞发布了星...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...我们发现很多年轻用户戴着我们的AR眼镜,去拍第一视角视频,包括使用AI语音询问周边的信息。”李未可科技创始人兼CEO茹忆说到。而这也是用户驱动李未可科技在室外运动场景后,拓展研学、CityWalk等文旅场景等一大原因。在...……更多
2024年投资展望丨AI、MR、短剧等概念爆发,传媒板块去年逆市涨近17%
...,多家厂商快速布局卡位多模态大模型,AI文生图、文生视频等多模态能力持续提升带动AI应用持续迭代升级。海内外爆款AI应用频现,如Pika 1.0、Runway、妙鸭相机等应用快速走红。(图源:东吴证券)机构指出,多模态模型将成...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...图像,预加载的示例表现非常出色,生成的3D模型和渲染视频以显著的准确性捕捉了原始2D图像的本质和细节。该研究团队利用预训练的视频人工智能模型生成合成3D数据,使他们能够训练更强大的3D生成系统,解决了长久以来的3...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...次利用大语言模型进行文本推理,最后利用语音合成系统生成并输出语音。然而,类似的多阶段串联系统存在一些缺陷,比如模型无法理解语音中包含的情绪及其它非文本内容信息;同时由于额外的语音识别及合成带来的时间开...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...型。Gemini在MMLU的得分率首次超过人类专家。来源:官方视频 Gemini包括一套三种不同规模的模型:Gemini Ultra是最大、功能最强大的类别,被定位为GPT-4的竞争对手;Gemini Pro是一款中端型号,性能优于GPT-3.5,可扩展多种任务;Gemin...……更多
...台,汇聚了大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...痛点问题;大模型对创新是否带来真正的改变。想建一个视频创作平台,如何应对AI算力托管、AI模型治理、推理加速等方面的挑战?如果算力被“卡脖子”了,如何能让大模型平稳部署在信创设备上?对于小型团队来说,如果...……更多
大模型“遍地”都是,谁能真正解放生产力?
...越多的客户表示,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...绕「天工」系列大模型建起AI大模型、AI搜索、AI音乐、AI视频、AI社交、AI游戏等AI业务矩阵,是国内模型技术与工程能力最强、布局最全面的人工智能科技企业之一。这一年里,除了对「天工」系列基座大模型进行不断升级迭代...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...人员提出了一种新颖的多步误差最小化(MEM)方法,用于生成多模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
...能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微信小程序IT之家获悉,山海多模态大模型有如下特点:实时秒回,自由插话:与现实对话中人类的响应时间相...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...产业落地元年。时至今日,OpenAI在2024年初推出了文本到视频生成模型Sora,被认为是目前最好的视频生成模型,让大家看到了构建物理世界通用模型的可能路径。唐杰分析,“OpenAI极有可能在2024年推出下一代模型GPT-5,也许会有...……更多
实体“贾维斯” vivo发布PhoneGPT:可自动打电话定餐厅
...觉的感知和理解能力,能够对手机屏幕更深度的理解,在视频流的实时对话上也更加流畅自然。蓝心语音大模型、图像大模型和多模态大模型,综合能力都获得行业机构的高度认可,在多家专业榜单上位列第一。【本文结束】如...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...人工智能可以像人类一样感知和理解音频、文本、图像、视频等多种模态信息,并与人类进行更加自然高效的交互,展现出了强大的功能和广泛的商业应用前景。 多模态能力是实现通用人工智能的重要路径之一,也是趣丸科技...……更多
AI拜年火了,通义千问上线一张照片生成拜年视频
...全民舞王应用也迎来上新,用户可通过一张照片生成拜年视频,用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费“拍”全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...也不容易,因为我们需要的是多模态数据,但LLM无法直接生成图像,DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起,直接生成但文生图模型实际上很难对图像细节做到细微精...……更多
CVPR最佳论文被生成式AI占领,清华武大华南农大上科校友获奖
...的场景运动建模方法,可用于通过静态图像生成无缝循环视频,还能实现与图像中对象的交互。这项研究来自谷歌,一作谷歌DeepMind研究员Zhengqi Li(李正奇)。最佳学生论文奖也一同公布。一篇BioCLIP: A Vision Foundation Model for the Tr...……更多
AIGC工具测评:生成式AI的产品表现如何
...工具,它们按功能可以划分为:文本生成、图像创作、音视频处理等多个类别。在这篇文章中,我们将探讨这些工具的表现,通过实际体验和评估,为读者提供一个关于当前AI工具的全面视角。一、ChatGPT-4所属公司:OpenAI 发布时...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...lassification)——深度学习表明,人类可训练AI,对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中,即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”,“对话才是未...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
AI视频生成赛道风起云涌,国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下,当下的视频生成模型各方面已经接近“以假乱真”的效果。但与此同时,大部分视频生成模型的准确程度、遵循指令的能力还...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。 「天工SkyMusic」具有以下五大特点:1. ...……更多
本周硅谷发生了什么?| 高通第三代骁龙8;谷歌20亿美元追投Anthropic;联想拿出能跑大模型个人PC
...件的交互方式。未来,AI PC可以直接基于电脑上的照片和视频,直接剪辑生成内容。它也可以作为工作助手,写文档或者提炼总结要点。Meta公布2023年第三季度财报10月25日,Meta公布截至9月30日的2023财年第三财季业绩,第三财季...……更多
AI角色创作平台「捏Ta」完成超千万元融资
...以来,捏Ta的社交媒体曝光量已达到约2.5亿次,多次位列视频号动漫游戏日榜前十。捏Ta在社交媒体上的曝光。图源:看见概念捏Ta团队认为,AIGC技术的发展对图像生产带来的最大改变是,生产资料从原有的像素或图层,变成了...……更多
喜马拉雅音频大模型亮相,AI赋能内容创作者
...雅在云栖大会展示了“珠峰AI创作服务平台”:珠峰AI音视频创作平台,依托通义文本大模型对文本内容语义的深度理解,打造珠峰AI音频大模型,结合喜马拉雅独有的全品类音色库和数字人大模型,为创作者提供高品质的AIGC音...……更多
...提升数据精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平...……更多
更多关于社会的资讯:
交通银行:新户最红5折权益体验
11月新户核卡就送最红5折直通权益专属活动,无需消费达标。权益抽三选一,百分百有奖。满40立减20/微信或支付宝。满80立减50/美食红包
2025-11-21 15:41:00
试管婴儿C级胚胎能移植吗?家恩德运生殖中心:有胚胎就不要放弃
生命的降临有时是一场需要披荆斩棘的旅程,对很多人来说这条路走得尤为漫长与艰辛。做试管遇到C级胚胎,该何去何从?接下来就和家恩德运生殖中心一起看一个经典案例
2025-11-21 15:43:00
新时代温州学与浙学思想研讨会在浙江温州举行
中国古代思想的地域性传统——新时代温州学与浙学思想研讨会11月15日,“中国古代思想的地域性传统——新时代温州学与浙学思想研讨会”在浙江温州召开
2025-11-21 15:37:00
“中国好人榜”候选人訾洪玉:一抹“石油红” 十二载“公益路”
在吉林松原,有一抹鲜艳的“石油红”格外引人注目。这红色,是吉林石油工装的颜色,更是訾洪玉那颗跃动十余年的赤诚爱心。近日
2025-11-21 13:53:00
临沂八中举行《教师的语言力》读书分享活动
鲁网11月21日讯11月19日,临沂第八中学阅览室内书香氤氲、气氛温馨,学校读书团队“春华秋实”小组在此成功举办以《教师的语言力》为主题的读书分享活动
2025-11-21 11:31:00
肺叶切除后,他找到了第二人生丨e路声花④
大河网讯 “医生说我肺活量从5000掉到3800,这辈子可能完了。” 谁能想到,曾因肺叶切除手术陷入绝望的朱唯一,如今正身着简约西装
2025-11-21 11:27:00
外国人来华入境卡网上填报新政实施 厦口岸入境旅客点赞
外籍旅客点赞入境卡网上填报方便快捷,让通关效率更高。外国人入境卡昨起网上填报。厦门网讯(文/图 厦门日报记者 杨霞瑜 通讯员 付佳萍)“特别节省时间
2025-11-21 08:45:00
承认贷款没办下来,但服务费啥时候退,公司没有明确答复。今年8月,市民孙先生接到一助贷公司电话,询问其是否有资金需求。“我是做生意的
2025-11-21 07:05:00
【人文医院建设】关怀从\
鲁网11月20日讯为扎实推进人文医院建设,切实解决患者及家属就医期间的理发难题,提升患者和家属的就医体验,日前,石岛人民医院携手斥山凤凰社区
2025-11-20 13:55:00
暖心!270 路公交驾驶员拾金不昧 2000 元手机完璧归赵
鲁网11月20日讯“滕师傅这种拾金不昧的精神太让人感动了,不仅帮我挽回了损失,更让我感受到了这座城市的温暖!”11 月 4 日
2025-11-20 13:57:00
用考古人手中的笔 在数字时代唤醒“有温度的观察”
大河网讯(记者 莫韶华)近日,由郑州市文物局主办、郑州市文物考古研究院承办的2025郑州市文物考古绘图培训班在郑州举行
2025-11-20 13:58:00
这个冬天来长春,有冰有雪有流量,更有暖到心尖的长春温度
“吉林冰雪焕新季”之长春冰雪行正在火热进行中!19日的行程从清晨到日暮,把长春的冰雪魅力、流量密码和暖心服务挨个解锁,这份北国冬日限定快乐
2025-11-20 14:18:00
鲁网11月20日讯近期,一位神色焦虑不安的母亲匆匆走进农行颜店时代支行,手里紧紧攥着一个塑料袋,直奔网点兑换。经工作人员询问后得知
2025-11-20 14:29:00
近日,聋哑客户王先生走进张家口农商银行宣泰支行网点办理转账业务,柜员小张主动拿出纸笔,通过“纸条对话”的方式耐心沟通,全程细致周到
2025-11-20 14:31:00