• 我的订阅
  • 头条热搜
...人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究...……更多
谷歌发布Translatotron 3 模型
...今天发布新闻稿,正式介绍推出了名为Translatotron3的新AI模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。谷歌于2019年推出了TranslatotronS2ST系统,于2021年7月推出第2个版本,在2023年5月27日发布的一篇论文中...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...EglhJA与此同时,智谱还重磅宣布,该功能背后的情感语音模型 GLM-4-Voice 同步正式开源。不久后,相关能力还将上线视频通话,为所有用户提供一个既能「看」又能「说」的 AI 语音助理。开源地址:https://github.com/THUDM/GLM-4-Voice自...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...发者大会于10月10日在广东深圳正式召开,vivo发布自研大模型——全新蓝心大模型矩阵,为用户和开发者带来诸多惊喜。在同日举办的人工智能会场上,vivoAI团队分享了在AI领域取得的最新成果,以前沿解决方案引领大模型创新...……更多
AIGC工具测评:生成式AI的产品表现如何
...这一年,AI展现出了前所未有的发展势头,无论是在基础模型能力、实际应用场景,还是资本投入方面都取得了显著进展。特别是在2022年11月30日,OpenAI发布了ChatGPT,标志着AI技术的一个新纪元。紧接着,在2023年1月,ChatGPT的月...……更多
全面透视豆包:功能、版本、价格、优势、应用
...率与竞争力。一、豆包介绍豆包是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页、客户端、APP、插件等形式。...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。在纯文本...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...编辑|邓咏仪1月30日,科大讯飞发布新升级的讯飞认知大模型星火V3.5,并发布了自研的语音大模型,以及星火开源大模型——星火开源-13B。过去一年,科大讯飞的重点都在大模型方向上,临近岁末放出大量更新,某种程度也展...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
四大新功能让生成式AI“如虎添翼”
...能(AI)技术,通过已有数据寻找规律,并通过预训练大模型、生成式对抗网络等方法,自动生成各种类型的内容,例如文章、视频、图片、音乐、代码等。AIGC代表了AI技术发展的新趋势。过去传统AI偏向分析能力,而现在AI正在...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指令,且能回答关于苹果产品...……更多
融资1600万美元,这家法国AI创企推新语音转录引擎,支持100种语言
...识别他的法语口音。他说:“考虑到目前大多数语音识别模型主要在英语音频数据上训练,存在固有的偏见,Gladia优先构建了第一个真正多语言的实时产品。”此外,Gladia引擎的特别之处在于能够即时从对话中提取信息,如来电...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
【新智元导读】继去年初的第一代VALL-E模型之后,微软最近又上新了VALL-E 2模型,标志着第一个在合成语音稳健性、相似度、自然程度等方面达到人类水平的文本到语音模型。最近,微软发布了零样本的文本到语音(TTS)模型VAL...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI...……更多
思必驰天琴语音助手全面接入DeepSeek:中枢大模型驱动车载交互持续进化
...:依托车端、云端感知数据和DUI平台、客户端编译中台、模型训练中台、大数据中台等,实现多车协同与云端数据联动,提升了整体的效率和决策能力。这一底层架构全方位提升了天琴语音助手 8.0 的性能,实现了从指令执行到全场景...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...4o 的平均音频响应延迟 320ms。以 ChatGPT 为代表的大型语言模型(LLM)已成为强大的通用任务解决器,但大多数 LLM 仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型,它...……更多
chatrtx正式上线:ai加速、语音交互、ai语音识别
...它用到了TensorRT-LLM和NVIDIARTX加速技术,是显卡应用大语言模型的一个技术演示demo。最近,NVIDIA宣布——ChatwithRTX正式更名为ChatRTX。这次的更新增加了许多新功能,例如在新版本中加入了对智谱AI的ChatGLM3-6B这个中文LLM的支持,同...……更多
Galaxy S24系列上线大模型!三星:不排除未来Galaxy AI收费的可能性
...厂商如华为、小米、vivo和荣耀均在旗舰手机上搭载了AI大模型功能。业内人士认为,目前需要先让用户感知到AI大模型带来的便利性,才会让消费者产生换机的欲望,并且目前手机端的AI大模型尚处于初期,收费和盈利模式都需...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...今天凌晨,谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0。这是谷歌迄今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中...……更多
首个VR端3D角色扮演AI发布!南洋理工公开SOLAMI技术报告,端到端VLA模型驱动,唱跳都能陪你玩
...进行沉浸式互动。该系统利用先进的社交视觉-语言-行为模型,结合合成的数据集,提供更自然的交流体验,超越了传统的文本和语音交互。世界上第一个VR端 3D版的角色扮演AI就在刚刚诞生了!AI角色扮演类游戏(如C.AI、Talkie)...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...服务已备案信息》,截止至今年 3 月,我国已有 117 家大模型成功备案。除了部分面向 B 端的行业大模型之外,过去一年,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...可用本地API的Copilot库WindowsCopilotLibrary,称有40多种端侧AI模型“开箱即用”,展示了将Copilot全面融入个人电脑(PC)的新型PCCopilot+PC如何与AI应用程序(App)密切结合。周一微软介绍过WindowsCopilotRuntime中包含超过……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...】新年伊始,OpenAI 扔出一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...:新华网作为人工智能领域最重要的突破性进展之一,大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日,在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息...……更多
标贝科技GPT语音助手测评:看语音大模型如何重塑语音交互体验
...步,语音助手已经融入了我们生活的方方面面。同时在大模型落地千行百业的大潮之下,语音助手也快速卷入AI革命的浪潮中。GPT大模型作为一种强大的语言生成模型,通过语言理解、生成能力和上下文记忆能力,不断地自我完...……更多
英伟达宣布rtx系列显卡支持微软copilot+计划
...玩家指令,并结合游戏画面中的信息,通过人工智能视觉模型进行分析处理。这些模型可以增强大型语言模型(LLM)的情境感知和特定应用程序理解能力,并结合游戏知识数据库,生成针对性的文本或语音回复。发布会上,英伟达...……更多
更多关于社会的资讯:
合肥蒙城路一过路涵洞引发关注 常有人来此拍照打卡
大皖新闻讯 在合肥蒙城路桥南边,藏着一个圆形过路涵洞,高约2.3米,从蒙城路底下穿过,供行人、电动车通行,虽然人流量不大
2025-12-09 19:22:00
“两部手机连根线就赚钱?”中国移动拆穿兼职骗局,配合打击GOIP窝点
“不用开口,两部手机连根线就能日赚500元”——这样的“神仙兼职”听着是不是特心动?近日,中国移动江苏无锡分公司(以下简称“无锡移动”)联合市公安局反诈中心
2025-12-09 18:47:00
两只野猪现身合肥一小区?物业:全面排查后确认只有一只
大皖新闻讯12月8日晚,合肥绿地滨湖国际花都小区多位业主发布视频,称小区内惊现一大一小两只野猪。小区物业称,对小区地面
2025-12-09 15:52:00
“新风致——2025长三角高等艺术院校研究生学术创新论坛”举办
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)“新风致——2025长三角高等艺术院校研究生学术创新论坛”,近日在江苏南通大学艺术学院举办
2025-12-09 11:38:00
新人们筹办婚礼的过程中,大多会选择去拍摄婚纱照,留下步入婚姻殿堂的珍贵纪念。可是,您能想象吗?如果有一天您精心拍摄的婚纱照
2025-12-09 11:53:00
守护消费权益 衡水市桃城区分局筑牢安全防线
为切实规范市场经营秩序,保障群众消费安全,近日,衡水市市场监管局桃城区分局聚焦超市、便利店等与群众生活密切相关的经营主体开展监督检查
2025-12-09 12:16:00
堵塞、封闭疏散通道,肯德基秦皇岛山海关餐厅被罚3.29万元
据信用中国官网公开信息,2025年12月3日,因“占用、堵塞、封闭疏散通道、安全出口”,天津肯德基有限公司秦皇岛山海关餐厅被秦皇岛市山海关区消防救援大队罚款3
2025-12-09 12:23:00
当事人:打开那一刻,人都吓蒙了!山姆麻薯盒内出现活鼠
被视为中产阶级消费品质标杆的山姆会员商店,正面临一场突如其来的信任危机。12月9日凌晨,一则“深圳山姆极速达麻薯盒中发现活老鼠”的消息在社交平台快速传播
2025-12-09 13:51:00
正在深入调查 官方通报“辽视文化传媒”编造获奖名单事件
国家级铁岭经济技术开发区微信公号9日发布了一则情况通报:近日我们关注到,有媒体反映“辽视文化传媒”新媒体平台在2024年6月10日推送的“2024多彩中国少年朗诵艺术家展演”获奖名单中有部分人名与网络人名大全内容
2025-12-09 13:52:00
你家里有这样的体温计吗?明年开始全面禁止生产了!
大皖新闻讯 近日,国家药监局综合司5年前发布的一则通知引发舆论关注。大皖新闻记者在国家药监局网站上看到,2020年10月14日
2025-12-09 13:35:00
突然闭店,会员权益被强制“缩水”转移!合肥滨湖一健身房遭多市民投诉
大皖新闻讯 近日,合肥多位市民向大皖新闻记者反映,位于滨湖新区金陵大饭店内的博锐健身房突然停止营业,导致多名消费者已充值的预付款无法退还
2025-12-09 13:00:00
东南网12月9日讯(本网记者 卢金福)今日上午,福建省委宣传部召开“在中国式现代化建设中奋勇争先 奋力谱写新征程新福建建设新篇章”系列主题新闻发布会(第三场)
2025-12-09 12:02:00
䴙䴘受伤落难,霍山警民合力救助
大皖新闻讯 六安霍山警方12月8日发布消息称,该县群众在田间发现一只受伤的、长相奇特的小鸟,报警后,该小鸟得到救护,并被认出是一只䴙䴘
2025-12-09 12:24:00
“书香如故——田蕴章书作展暨研讨会” 将在津举办 扫码阅读手机版
为纪念著名书法家、书法教育家、南开大学教授田蕴章先生,推动传统文化和书法艺术的传承发展,不断满足人民群众精神文化需求,天津市文学艺术界联合会
2025-12-09 11:46:00
厦门网讯(厦门日报记者 陈泥)为营造法治公平的税收营商环境,近年来厦门税务部门持续深化跨部门协作,依法打击各类涉税违法犯罪行为
2025-12-09 08:57:00