• 我的订阅
  • 头条热搜
AI 将完全取代前端开发吗?
...自动化许多重复性的任务。例如,AI 可以自动处理图片、音频和视频等媒体文件,或者自动生成 HTML 和 CSS 代码。这些自动化工具可以大大提高开发效率和减少错误。其次,AI 还可以根据用户需求自动调整设计和功能。例如,当...……更多
今年 WISE大会的“AIGC”含量有多高?超有料揭秘提前看
...的日渐成熟,以自动化、智能化的方式,将文本、图像、音频、视频等多模态数据重新组合,创造全新和从未有过的内容,在降低成本的同时,也打破了各个模态之间的“技术壁垒”,这就是视频AI的优势所在。11月8日,36氪WISE2...……更多
当GPT-4o 成了网恋平替
...GPT-4o具有强大的实时多模态交互性能:它可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。这意味着,GPT-4o可以直接理解、直接生成音频或者视频一切内容,而无需通过文字的转译...……更多
【重磅】OpenAI最新解密,ChatGPT的本质是无损压缩器
...强大的无损压缩器视觉信息是知识的富矿:从文本走向多模态大数据时代的数据荒:运用合成数据破局AGI对人类社会经济活动影响:展望与思考写在前面:熵简科技是一家专注于帮助资管机构实现投研数字化的科技公司,主要客...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...型;4000亿参数、全球最大规模的开源MOE大模型。首先谈音频模型。据美国风投机构a16z上月发布的生成式AI产品Top 100报告,ChatGPT、Gemini等通用内容生产应用仍占据消费级AI应用大头。与6个月前的排名相比,有两个新类别首次进入...……更多
谷歌全面反攻 ChatGPT!PaLM 2、Gemini 双杀,Bard 正式开放
...事”,Meta 开源 ImageBind 新模型,超越 GPT-4,对齐文本、音频等 6 种模态! 返回搜狐,查看更多责任编辑: ……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...体验。近期,标贝科技借助自研的语音合成测评系统,从音频音色的真实度、发音准确率、副语言表达三个维度,对几款主流GPT语音助手进行了全面的测评,深入了解当前GPT语音助手的合成音色质量,给用户提供更多的选择依据...……更多
...奇琦:从ChatGPT到Sora,是一个从单一文本到文本、图片、音频、视频多模态进阶的过程。虽然形态上有区别,但其本质都是通用人工智能拼图中的一部分,是实现通用人工智能前的一些小目标,具有内在连贯性。OpenAI接下来可能...……更多
Meta开源多感官人工智能模型,整合文本、音频视觉等六类数据
...智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系...……更多
大模型的未来,快手在自己身上找答案
...,融合了当前最先进的语音预训练方法,并依托海量优选音频数据打造而成。该模型不仅支持普通话、英语及多种方言,还以其卓越的性能表现和极低的推理时延脱颖而出,广泛应用于快手的多种场景。理解了外部世界之后,受...……更多
出门问问亮相2024世界人工智能大会,再掀AIGC新审美浪潮
...。依托序列猴子大模型,「魔音工坊」可通过3-10秒的短音频,快速地实现声音克隆,并支持跨语言迁移、情感语气生成。其海外版DupDub还支持多语音音频生成,目前已涵盖英语、法语、日语、西班牙语、葡萄牙语、泰语等。 声...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...数工作都集中在单一数据模态上,如视觉,语言,图,或音频等。这种单模态的关注忽略了现实世界环境的多模态本质,因为现实世界环境本身就很复杂,由不同的数据模态而不是单一模态组成。 随着多模态数据的快速增长,...……更多
谷歌最强小屏旗舰!谷歌Pixel 9发布:5700元起
...味着谷歌Pixel 9系列不仅可以理解文本,还能理解图像、音频和语音。其它参数方面,谷歌Pixel 9前置1050像素,后置5000万主摄和4800万超广角,电池是4700毫安时,支持45W快充。值得注意的是,谷歌Pixel 9出厂预装Android 14,并非Android...……更多
GPT-4就是冲着赚钱来的!
...懂图片的内涵。在自然语言处理(NLP)中,文本、图像和音频信息都可以共同帮助理解和生成更丰富的内容。同样,在计算机视觉任务中,文本和图像信息“齐发”可以提高目标检测和场景理解的准确性。“具备多模态的生成能...……更多
本周(4.8-4.14)AI界发生了什么?
...版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一次“狙击”谷歌,紧接着发布非预览版的GPT-4 Turbo,将之前独立的 GPT-4 Vision直接集成到模型中,只需一次API调用,该模型就可以分析...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...超拟人的语音合成效果。其首批40个语种平均MOS分(评估音频或视频质量的一种标准,5分为最高)提升了0.25,拟人测试中MOS达到4.5分,拟人度达到83%,拟人语音合成能力超越ChatGPT。星火语音大模型开源方向上,此次科大讯飞发...……更多
云知声荣登甲子光年榜单,彰显AI大模型商业潜力
...态大模型,该模型通过整合跨模态信息,能够接收文本、音频、图像等多种形式的输入,并实时生成文本、音频和图像的任意组合输出,带来了实时多模态拟人交互体验,开启了通用人工智能(AGI)的新范式。目前,在通用能力...……更多
讯飞星火V3.0发布,打造每个人的AI助手
...学自动提炼规律、小样本学习、代码项目级理解能力、多模态指令跟随与细节表达等能力,进一步提升星火的落地应用能力。升级AI人设、启发式对话,打造每个人的AI助手自讯飞星火9月5日全民开放后,当前已有1200万用户,也...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。GPT-4发布后,A股市场的ChatGPT概念股并没有延续数月前的疯...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费级GPU上运行。除了免费、开源,该模型还注重保护创作者版权,在数据训练...……更多
盘前情报|2024年春节档票房、观影人次均创新高;Sora面世,机构预计AI视频进入大规模应用前夜
...域产生深远影响;3)AI视频应用在算力消耗上远超文本、音频及图像,建议关注推理端算力需求提升,以及后续其商业化程度是否能形成收入和投资的正反馈。华鑫证券认为,Sora的推出有望推高AI多模态的热度,可关注AI多模态...……更多
...还需要哪些技术支持?司马华鹏称:“我们的大模型是多模态的,是文本生成、声音生成和数字人生成的结合。其实很多人在反馈,他(刘强东)声音和节奏感与他原来讲话不太一样。这很可能克隆的是平时的语速,但是直播(...……更多
四川省首批8个人工智能高质量数据集发布
...后,在格式、质量等方面符合相关要求,以文本、图像、音频、视频等多模态呈现,可直接用于开发和训练人工智能模型的数据集,包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源...……更多
AIGC按下昆仑万维的全球化加速度
...型调出来后,Star X在东南亚与中东核心国家排到了音乐和音频下载榜前三。接着它拿下了拉美和俄罗斯市场,今年的重点是欧洲。2021 年上半年,Star X 用户日平均在线时长为 49 分钟,仅次于 YouTube(77 分钟)、Tiktok(71 分钟)和...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说,他们做出了以下贡献:(1)他们提出了 SoccerReplay-1988,这是迄今为止最大的多模态足球数据集,其中包括来自 1988 场完整比赛的视频和详细注释,...……更多
更多关于科技的资讯:
车主大爱小米SU7 Ultra碳纤维双风道前舱盖 完全复刻原型车
快科技2月27日消息,小米汽车发文称,很多小米SU7 Ultra准车主,都非常期待碳纤维双风道前舱盖。他们说,无他,就是觉得非常帅气
2025-02-27 07:35:00
“小巨人”企业订单猛增
昨日,位于江北新区的南京洛普科技有限公司车间内,工人正在装配、测试LED面板,赶制订单。该企业是国内率先研制、生产大型LED显示屏的企业
2025-02-27 08:04:00
南报网讯(通讯员倪雯记者孙秉印)江宁城市运行专属虚拟数字人“AI云务员”26日上线,该举措将有助于进一步提高政府办公效率
2025-02-27 08:04:00
陈震测试特斯拉FSD连夜处理7个违章:司机仍是第一责任人!
快科技2月27日消息,近日,特斯拉FSD自动驾驶系统正式在国内开启测试,虽然是需要6.4万元选装,但还是有一些头部汽车博主第一时间进行了测试
2025-02-27 08:05:00
百位AI创想者齐聚杭州城西科创大走廊送出“七个一”专享政策礼包 最高将资助1亿元杭州日报讯 昨天,由中央广播电视总台联合杭州市人民政府主办的《赢在AI+》首届未来营
2025-02-27 08:14:00
火车到终点站后 车头与车厢为什么分开走
快科技2月27日消息,大家知道吗?普速列车到终点站后,车头与车厢是分开走的。今天中国铁路官方进行了科普,原来,普速列车的车头和车厢隶属于不同的管理单位
2025-02-27 08:35:00
耳朵里长“脚气” 竟然是因为这个很多人都爱的活动
很多人都在网上刷到过采耳视频:在可视化镜头下,一块块陈年污垢被掏出来,要多解压有多解压。还有许多博主会前往采耳机构探店
2025-02-27 08:35:00
欧盟批准面包虫粉末放入面包!此前还将蟋蟀粉加入食物
快科技2月27日消息,据媒体报道,从2月起,欧盟消费者开始在日常饮食中发现一种新食材:黄粉虫(Tenebrio molitor)幼虫粉末
2025-02-27 08:35:00
英伟达利润大增80% 黄仁勋感叹:Blackwell需求惊人
快科技2月27日消息,据报道,英伟达今日公布了该公司的2025财年第四财季及全年财报。财报显示,第四财季营收达到393
2025-02-27 08:35:00
恒洁焕新中国行:树立家居行业\
2025年,以旧换新政策进一步加大力度,消费市场呈现繁荣景象。据商务部统计,春节期间,全国以旧换新实现销售860万台商品
2025-02-27 08:44:00
厦门网讯(厦门日报记者 楚燕 通讯员 陈雯 罗超)在电脑上打开医院电子病历系统,在任务栏点击DeepSeek,屏幕右侧立马出现智能问答对话框
2025-02-27 08:51:00
还有100天!35岁再考清华当事人备战2025高考:目标700分 想拿状元
快科技2月27日消息,依然有很多人在执着于高考,而且非北大清华不上,对此你怎么看?“35岁再考清华”当事人李龙晒视频称2025高考100天倒计时
2025-02-27 09:05:00
传V社开发高阶VR头显
消息人士称,Valve计划年内发布一款价位1200美元(接近一万元人民币)的VR头显,内部代号“Deckard”。其定价之高仅次于AVP与Meta Quest Pro
2025-02-27 09:05:00
浩鑫发布新款XPC nano NA10H7:搭载锐龙7 8845HS 体积仅1L
快科技2月27日消息,浩鑫推出新一代准系统XPC nano NA10H7,整体尺寸为132 x 143 x 55 mm
2025-02-27 09:05:00
英伟达业绩超预期!黄仁勋:说AI不需要更高端硬件的可以洗洗睡了
快科技2月27日消息,备受业界瞩目的英伟达业绩出来了,结果出奇的好,远远超出市场的预期。在2025财年,英伟达总共实现1304
2025-02-27 09:35:00