• 我的订阅
  • 头条热搜
谷歌发布Translatotron 3 模型
...今天发布新闻稿,正式介绍推出了名为Translatotron3的新AI模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统,于2021年7月推出第2个版本,在2023年5月27日发布的一篇论文中...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...发者大会于10月10日在广东深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领域取得的最新成果,以前沿解决方案引领大模型创新...……更多
AIGC工具测评:生成式AI的产品表现如何
...这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月...……更多
全面透视豆包:功能、版本、价格、优势、应用
...率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页、客户端、APP、插件等形式。...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
四大新功能让生成式AI“如虎添翼”
...能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现在AI正在...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指令,且能回答关于苹果产品...……更多
融资1600万美元,这家法国AI创企推新语音转录引擎,支持100种语言
...识别他的法语口音。他说:“考虑到目前大多数语音识别模型主要在英语音频数据上训练,存在固有的偏见,Gladia优先构建了第一个真正多语言的实时产品。”此外,Gladia引擎的特别之处在于能够即时从对话中提取信息,如来电...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
chatrtx正式上线:ai加速、语音交互、ai语音识别
...它用到了TensorRT-LLM和NVIDIARTX加速技术,是显卡应用大语言模型的一个技术演示demo。最近,NVIDIA宣布——ChatwithRTX正式更名为ChatRTX。这次的更新增加了许多新功能,例如在新版本中加入了对智谱AI的ChatGLM3-6B这个中文LLM的支持,同...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...厂商如华为、小米、vivo和荣耀均在旗舰手机上搭载了AI大模型功能。业内人士认为,目前需要先让用户感知到AI大模型带来的便利性,才会让消费者产生换机的欲望,并且目前手机端的AI大模型尚处于初期,收费和盈利模式都需...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...服务已备案信息》,截止至今年 3 月,我国已有 117 家大模型成功备案。除了部分面向 B 端的行业大模型之外,过去一年,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...】新年伊始,OpenAI 扔出一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...:新华网作为人工智能领域最重要的突破性进展之一,大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日,在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...步,语音助手已经融入了我们生活的方方面面。同时在大模型落地千行百业的大潮之下,语音助手也快速卷入AI革命的浪潮中。GPT大模型作为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完...……更多
英伟达宣布rtx系列显卡支持微软copilot+计划
...玩家指令,并结合游戏画面中的信息,通过人工智能视觉模型进行分析处理。这些模型可以增强大型语言模型(LLM)的情境感知和特定应用程序理解能力,并结合游戏知识数据库,生成针对性的文本或语音回复。发布会上,英伟达...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...利用少量有标签和大量无标签数据视频数据来训练自己的模型,并对模型在无标签数据集上的表现和泛化能力进行评估。该赛道获胜的关键在于通过改进半监督学习技术来提高模型情感识别性能,比如预测情绪类别的准确率。自...……更多
能“听懂”用户情绪的对话机器人,已成为营销获客新的“技术红利”
...活实验室在春节前做的一次暖心实验,依托京东云言犀大模型和言犀智能外呼产品,帮助那些害怕回家的人拨开云雾,看到那些心结背后的真实答案。教机器说话像真人,言犀用了什么“魔法”智能外呼拨出的电话,不仅能听懂...……更多
创新工场李开复:大模型领域只投资“AI-First应用”
...创新工场董事长、零一万物CEO李开复出席2024澜舟科技大模型技术和产品发布会,并发表《AI2.0平台变革进行式》主题演讲,对AI未来的发展趋势进行了展望。李开复表示,纯移动应用将成为过去式,未来生成式AI应用将占据主导...……更多
苹果在wwdc2024开启ai时代
...AI能力命名为AppleIntelligence,它能基于苹果内置的大语言模型,通过理解自然语言来执行用户的语音或文字指令,深度集成于iOS18、iPadOS18和macOSSequoia中,充分运用Apple芯片对语言和图像的理解与创作能力,可做出多种跨app操作,...……更多
更多关于科技的资讯:
鸿蒙智行再交成绩单!问界M8破3.6万台 全新M9破1.8万台
快科技3月7日消息,鸿蒙智行公布了问界M8和2025款问界M9的36小时小订“成绩单”。其中,问界M8小订量突破3.6万台
2025-03-08 00:15:00
站雷军背后的海尔总裁周云杰走红:可爱表情被网友拍下
3月7日消息,据媒体报道,在代表通道上,小米创始人、董事长兼首席执行官雷军人气高涨,人群中不停响起“雷总好”,雷军多次微笑挥手回应
2025-03-08 00:15:00
本文转自:人民日报3月5日,习近平总书记在参加江苏代表团审议时指出,科技创新和产业创新,是发展新质生产力的基本路径。政府工作报告提出
2025-03-08 06:26:00
谷雨  自研美白原料极光甘草  打造优质国货护肤品牌
本文转自:人民日报在化妆品行业蓬勃发展的浪潮中,在消费者对美白产品的需求日益增长的趋势中,美白护肤品已成为行业的重要细分赛道
2025-03-08 06:29:00
国补真香!平板销额上涨21% 手表/手环暴涨51%
快科技3月7日消息,今年1月20日,手机、平板等数码产品国家补贴在全国各地陆续上线,极大的带动了国内市场。根据洛图科技(RUNTO)数据显示
2025-03-08 07:15:00
酵母菌:微生物世界里手握核武的超级杀手
如果我们把水果或者谷物密封起来,那么过一段时间,我们再打开时就会闻到酒的清香,这是因为酵母菌将糖转化成了酒精和二氧化碳
2025-03-08 07:45:00
2025全国两会天津北方网讯:上线7天,能聊天、会推理的“DeepSeek”下载量已经破亿,当全球科技圈还在为它狂欢时
2025-03-08 08:03:00
家家悦济南环宇城店焕新亮相,品质消费生活圈引领新风尚
为积极响应山东省委、省政府的提振消费号召,家家悦集团以创新服务为核心驱动力,对济南中海环宇城店进行了全面而深入的升级改造
2025-03-07 21:22:00
可在室内外“无感”补电 全球首款钙钛矿太阳能充电手机发布
本文转自:人民日报客户端记者从京东方科技集团获悉:在西班牙巴塞罗那举行的世界移动通信大会上,传音旗下品牌Infinix发布全球首款应用了京东方钙钛矿光伏技术的太阳能充电手机
2025-03-07 21:25:00
依肤婗:匠心研发,打造肌肤焕变奇迹
近日,专业护肤品牌依肤婗(YIFUNI)推出"凝润舒颜套"系列新品,秉承"焕变赋能,宛若新生"的品牌理念,引发业内广泛关注
2025-03-07 21:26:00
依肤婗焕颜精华液:开启肌肤焕变奇迹之旅
广州讯-知名专业护肤品牌依肤婗(YIFUNI)日前隆重发布全新"焕颜精华液",引领护肤新趋势。该产品凭借创新配方和显著功效
2025-03-07 21:26:00
干货分享!2025英国国际美博会(GBE. UK 2025)参展全攻略
大家好,我是一名在美业摸爬滚打多年,专注拓展海外市场的市场经理。这几年外贸形势愈发严峻,竞争激烈程度堪称“内卷大战”。但今年我发现了一个绝佳机会——2025英国国际美博会(GBE
2025-03-07 21:27:00
政通智合·数聚泉城 共创政务AI新场景山东移动DeepSeek政务场景共创沙龙成功举办
3月7日,山东移动与华为联合举办DeepSeek政务场景共创沙龙。本次沙龙以“政通智合·数聚泉城 共创政务AI新场景”为主题
2025-03-07 21:36:00
REDMI K80至尊版看点汇总:这配置又要卖爆了
最近,REDMI宣布了K80系列上市100天的好成绩,销量突破了360万台!不仅如此,为了庆祝这个历史性时刻,REDMI团队还收到了来自高通的蛋糕
2025-03-07 22:45:00
赛分科技(688758)是行业内少数同时具备分析色谱及工业纯化领域研发及规模化大生产能力的企业,分析色谱领域技术达到国内领先水平
2025-03-07 22:45:00