• 我的订阅
  • 头条热搜
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
GPT-4o的文本和图像功能开始在ChatGPT中免费推出,音频模式存在各种新风险而未公开,未来音频输出将仅限于选定的预设声音,并要遵守安全政策。GPT-4o生成图像:机器人正在输入日志条目,正文很大,清晰易读,机器人的手在...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...要额外的 ASR 或 TTS 系统。 推理过程中,可同时生成语音和文本信息,通过文本指导语音生成,有效降低语音推理的学习难度。 提出多阶段的训练方案,可通过少量开源或合成数据使任意语言模型具备语音交互能力。Mini-Omni 模...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...代表Omni,也就是“全能”的意思。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI CEO奥尔特曼(Sam Altman)在博客中表...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...er模型取得了比扩散模型更好的结果,只有900M参数,但在推理时间上比StableDiffusion1.4版本快3倍,比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比:文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...本数据,分别用音频编解码器编码器(audio codec encoder)和文本分词器将其表示为编解码器代码=[0,1,…,(−1)]和文本序列=[0,1,…,(−1)],用于自回归(AR)和非自回归(NAR)模型的训练。 AR和NAR模型都采用Transformer架构,后续的评...……更多
高通推出骁龙xelitepc平台新品
...门面向高算力需求的NPU,以及高通传感器中枢,它们在AI推理过程中扮演不同角色。如今异构计算也随着骁龙XElite/XPlusPC平台被引入到AIPC领域,必将在AIPC的扩展和应用中大放异彩。 而在AI生态的建设方面,高通一开始就意识到...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...的「我在飞」,进一步询问的话,此外,video-SALMONN还能推理出男人的名字是「杰克」。我们都知道,正是这两句对白成就了这个经典场景,而video-SALMONN恰恰抓住了这个场景的精髓所在!再来一段《疯狂动物城》的动画片段:看...……更多
“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
...东西”。据介绍,GPT-4o可以实时对音频、视觉和文本进行推理,接受文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。OpenAI称,GPT-4o可以在短至232毫秒的时间内对音频输入做出反应,平均反应时间为...……更多
神隐少女《岚与山之彼端》Steam新品节试玩已开启
...并开放了游戏试玩。玩家将体验到一场充满恐怖、悬疑、推理、民间怪谈等多种元素内容的故事。Steam商店页面>>>>突然神隐的少女在五年前,大二学生五十岚真羽乘坐深夜电车前往苍京市参加一个灵异小众论坛举办的社...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...场景更多的是对商业化落地的探索,是大模型从训练走向推理的动能。伴随着垂直大模型的发展完善,大模型的应用才是打开更大成长空间的关键。边缘计算是一个明确的巨大的增量市场,目前已经发展至行业落地阶段,云计算...……更多
OpenAI推迟上线语音功能,GPT-5或要等到明年,大模型技术速度正在放缓
...c等对手的贴身追赶,后者最新发布的Claude 3.5 Sonnet在逻辑推理、数学编程等方面的性能均超越GPT-4o,但这款模型并未加入语音功能。因此,某种程度来看,GPT-4o在语音方面仍保持领先。但OpenAI推迟上线语音功能,则显示出,尽管...……更多
这几款2024创新音频产品,来一起畅享音乐!
...新科技在京东和天猫平台开启了重磅的惊喜福利活动,有新品上新首发优惠活动以及甄选产品福利等活动,且通通支持24期免息。今天就来推荐几款2024创新的甄选产品,不论是送礼还是个人使用都非常的适合,让我们一起来看看...……更多
Infocomm China2024见闻:大家每天忙于开会,却还没吃透怎么用好AI
...能也需要具备一定的端侧能力。假设有大量用户同时进行推理请求,会消耗大量的服务器计算资源,这对于服务商来讲,基于云端进行推理的成本是非常高昂的;而对于用户,基于端侧具备的计算能力,也会减少延迟,或者模型...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...生成式AI模型。通过对这些模型进行优化,开发者运行AI推理的速度将提升高达4倍。不仅是速度提升,优化后的模型占用的内存带宽和存储空间也将减少,从而实现更高的能效和更持久的电池续航。 这些优化模型将在高通AIHub、...……更多
高通aihub正式发布:支持75个ai模型
...生成式AI模型。通过对这些模型进行优化,开发者运行AI推理的速度将提升高达4倍。 不仅是速度提升,优化后的模型占用的内存带宽和存储空间也将减少,从而实现更高的能效和更持久的电池续航。这些优化模型将在高通AIHub、...……更多
google推出geminilive功能
...常生活的几乎所有方面为你提供帮助。它将能够与你实时推理,并轻松提供快速回复。Google表示,要想真正发挥作用,代理需要像人一样理解复杂多变的世界并做出反应--接收并记住自己的所见所闻,从而理解上下文并采取行动...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,「天工...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...图像的任意组合作为输入,实时对音频、视觉和文本进行推理,生成相应的输出。相比ChatGPT的文生文、文生图,Sora的文生视频等,GPT-4o是一个原生多模态的融合体。这一点,谷歌的Gemini Astra也能实现,支持多模态的推理。在演...……更多
三星公布2024年全新电视阵容,专注于激发和增强个人生活方式
...。三星表示,除了带来更强的图像和声音质量外,该系列新品还为消费者提供由三星Knox提供支持的AI功能,专注于激发和增强个人生活方式。首先,三星最新的NeoQLED8K搭载了三星迄今为止最新最强的电视处理器——NQ8AIGen3,其NPU...……更多
有道听力宝E6新品亮相 英语听口练习神器来袭
...水亲肤材质、专业级音响、高清大屏也体现了超高品质,新品首发价仅399!量身定制听力训练启蒙到高阶全覆盖有道听力宝E6囊括了海量优质的免费听力内容,覆盖从儿童启蒙到高中毕业各个学习阶段,包括RAZ、牛津树、红火箭...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
黄仁勋对话Transformer七子:我们被困在原始模型里,还需要更强大的新架构
...其不断交互才能变得聪明,待在实验室里并不会造福世界推理是下一个重要的进步节点,能提升数据训练效率,产生更有价值的结果对话实录部分要点整理Transformer因何横空出世?Illia Polosukhin:如果要做出能真正读取搜索结果的...……更多
联想thinkcentre家族新品品鉴会在京举办
...可显著加速艺术视觉呈现(如StableDiffusion)和大语言模型推理(如LLaMa)等内容生成和模型推理过程。用户还可选配英特尔酷睿i9-14900旗舰级处理器和GeForceRTX40608GB115W满功率显卡,获得卓越的AI计算和图形处理体验。为了保障AI应...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...标要求,即算法效果准确、模型预测的性能要最优、算法推理延时小于我们要求的阈值,保障用户能有良好的体验。经过长时间的迭代与验证,我们自研了一套端云协同三维一体智音体系,它主要在移动端语音识别、音色克隆TTS...……更多
年终惊喜福利大放送!创新科技音频好物等你来选
...手各种音频好物的朋友们带来了一大波惊喜福利,不只有新品可以抢先体验,全线产品也迎来了价格直降,更有分期免息和福利礼品,如此多优惠福利,此时不买更待何时!今天就借着这波创新年末大促销,给大家推荐几款值得...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经网络处理。行业内认为,这是一种可以将音频...……更多
...数模型Qwen-1.8B和音频大模型Qwen-Audio。开源模型Qwen-1.8B,推理2K长度文本内容仅需3G显存,可在消费级终端部署。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音...……更多
比尔·盖茨对话OpenAI CEO奥特曼:AI如何监管?白领和蓝领谁会更先失业?
...两人谈到了人工智能发展、趋势和监管等问题。多模态、推理和个性化是趋势,成本正在快速下降盖茨表示,最初对OpenAI快速发展充满疑问,称没想到ChatGPT变得这么好,并不理解背后的逻辑。奥特曼认为,目前在AI可解释性方面...……更多
...说,语言感知比图片视频感知更难,同时智力并不是逻辑推理,而是一种抽象和比喻的能力。他打比方称,牛顿曾用三大定律把万物之间的规律变成了数学问题,这对于人类而言是巨大的进步。今天的大模型也是将语言变成数学...……更多
高通第三代骁龙8的优势,并不仅仅只有性能
...算力。根据官方公布的信息显示,第三代骁龙8的Hexagon NPU推理速度比前代提升了近1倍,同时能效也增加了40%。而且正如前面所提到的那样,AI性能的提升同样是得益于更大的缓存、更大规模的NPU硬件、更快的内存带宽、升级的微...……更多
更多关于科技的资讯:
国内首台!全增材制造航空发动机完成压气机性能考核试验
快科技1月5日消息,据“中国航发”官微发文,中国航发自主研制的160公斤推力级增材制造涡喷发动机在株洲完成压气机性能考核试验
2025-01-05 20:16:00
最强天玑直屏旗舰!vivo X200S外观曝光
快科技1月5日消息,博主定焦数码绘制了vivo X200S渲染图,该机将在今年上半年登场。如图所示,vivo X200S延续了X200的环形相机设计
2025-01-05 20:16:00
南国智库·财经观察丨麦德龙落地、大润发Super开业……海口超市格局又有新变化
从2024年踏入2025年,海口超市格局又有了新变化。在2024年的最后一天,知名国际仓储会员制超市巨头麦德龙与海口日月广场签约
2025-01-05 20:42:00
体检查出这6种病不用过度治疗:很多“病”就是机体衰老的体现
1月5日消息,据媒体报道,随着年龄增长,身体会发生很多变化,比如皮肤失去光泽,皱纹越来越多,头发逐渐变白。除了外貌上的改变
2025-01-05 21:16:00
90岁网红奶奶吴老大去世 生前鼓励大家:不要难过 你们会越来越好
1月5日消息,据媒体报道,90岁网红奶奶“吴老大”去世,生前录视频鼓励家人 :不要难过,你们会越来越好。视频中她说道,当你们看到这个视频的时候
2025-01-05 21:16:00
00后格力人带来活力革新:奇葩商标背后的战略布局与创新驱动
近年来,格力给我们的印象往往是高品质空调的代名词——“好空调,格力造”这一广告语已经深入人心。然而,随着市场环境的变化和年轻一代员工的加入
2025-01-05 16:45:00
CES热点前瞻:芯片大厂新品齐出 千余家中国公司亮相拉斯维加斯
作为年初惯例,全球最大科技盛会CES将在下周举行。数千家科技企业集体亮相拉斯维加斯,展示手头有哪些值得市场兴奋的前沿新品
2025-01-05 17:16:00
薛记炒货创始人亲述:靠3颗“心”,4个“法宝”,开出了1000门店
捧着坚果的“薛大叔”——薛记炒货创始人薛兴柱为庐友们分享了他从济南街头摆摊卖炒货,到如今完成A轮融资、全国门店开到近千家的创业历程
2025-01-05 17:22:00
“开合间 见非凡” 华为Mate系列尊享品鉴会圆满落幕
2024年12月31日,“开合间 见非凡”为主题的华为Mate系列尊享品鉴会,于山东省美术馆盛大启幕,此次活动汇聚了来自商业
2025-01-05 17:23:00
开新局 谱新篇丨十堰电子企业全力冲刺今年一季度“开门红”
十堰广电讯 新年开局,十堰各地电子企业铆足干劲,紧盯新品研发、市场销售,积极扩能提产,全力冲刺今年一季度“开门红”。兆丰电子
2025-01-05 17:31:00
年均发电6.78 亿度!三峡青口盐场渔光互补“光伏复合”项目并网
快科技1月5日消息,据“中国能建”发文,中国能建江苏院EPC总承包的三峡青口盐场450兆瓦渔光互补“光伏复合”项目成功完成首批并网工作
2025-01-05 18:46:00
女子吃5斤车厘子过敏肿成悲伤蛙 医生提醒:过量食用所致
快科技1月5日消息,据报道,广东一名女子因对车厘子的极度热爱,竟一口气让男友购买了整整5斤,结果却因此遭遇了严重的过敏反应
2025-01-05 19:16:00
全球首个人工智能机器植入系统落地博鳌乐城
南海网1月5日消息(记者 苏桂除)近日,国内顶尖的耳鼻喉科专家齐聚博鳌乐城国际医疗旅游先行区内的博鳌超级医院,通过该院引进的全球首个人工智能机器植入系统
2025-01-05 17:39:00
中建海龙打造可持续发展的城市新地标,福城南产业片区项目取得突
近日,深圳市龙华区福城南产业片区12-16宗地和12-19宗地项目成功突破“正负零”正式进入地上主体结构施工阶段。自底板浇筑到地下室结构封顶仅用了33天的时间
2025-01-05 13:39:00
你期待谁!蛇年央视春晚第一次联排:岳云鹏、孙越、张艺兴现身
快科技1月5日消息,据国内媒体报道,今日,2025年央视蛇年春晚首次联排,岳云鹏、孙越、张艺兴、刘宇宁、蒋欣、白鹿、金晨等多位明星现身央视大楼参与彩排
2025-01-05 13:46:00