音频,模态,重磅,文本,任务,情感头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成

百度打通两大国民产品！六边形AI创作新物种「自由画布」来了

...种格式，不论是文本类的doc、pdf、excel，还是多模态图像音频视频类的jpg、mp3/mp4等，自由画布全都支持！并且得益于百度文库和百度网盘的互通，百度网盘中的私域资料可以与百度文库公域资料融合为自由画布提供创作素材。因...……更多

2024-11-14 09:46:00六边形,画布,物种,国民,创作,自由

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...张鹏则表示，对于Sora的出现，他并不吃惊，因为立足多模态领域的深耕，智谱也正在做这件事。如今，“清影”面世，让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态，也让没有视频制作基础的小...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

支持1024帧、准确率近100％，英伟达「LongVILA」

...统、模型训练与数据集开发于一体。现阶段，将模型的多模态理解与长上下文能力相结合是非常重要的，支持更多模态的基础模型可以接受更灵活的输入信号，以便人们可以以更多样化的方式与模型交互。而更长的上下文使模型...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

“试用完谷歌的新AI模型，再也不爱GPT”

...现有的所谓多模态大模型，都是单独训练了文本、视觉和音频等模型，再把这几个拼接起来。这样出来的 “ 散装 ” 多模态大模型，在遇到图片、文字、语音或者视频同时出现时，只会分解出不同模块各自回答，然后汇总各个...……更多

2023-12-12 00:22:00模型,模态,模型,答案,大杯,能力

OpenAI欲打造AI行业的“苹果生态”？上线GPT Sto

...是更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制。图片来源：OpenAIGPT4 Turbo版提供128k的上下文窗口，因此，可以一次容纳相当于300多页文本内容的提示词。而原本提供的最长的上下...……更多

2023-11-07 13:56:00重磅,生态,现实,苹果,更新,价格

击败Gemini-1.5-Pro、GPT-4V，从容大模型多

...云从科技从容大模型在综合评测权威平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示，云从科技的从容大模型在该体系中的平均得分为 65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro...……更多

2024-06-29 09:36:00模态,从容,模型,能力,全球,模态

我市发布首批行业高质量数据集

...健康、城市治理等12个重点领域，类型包含文本、图片、音频、视频等多种模态。其中，中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据...……更多

2024-06-21 05:16:00高质量,数据,行业,数据,模型,海河

ChatGPT版「Her」被玩疯：哭着读诗，中文表现也很亮

...它和OpenAI当时演示的效果一样好。它显然能够生成更多音频，但存在限制。它令人毛骨悚然。大量无意识的线索让人感觉像是在与一个人交谈。并且Ethan教授还认为，这种非常自然、拟人的语音，正是改变人类与AI交互性质的关...……更多

2024-08-02 09:46:00中文,语音,网友,功能,地址,视频

免费！免费！免费！GPT-4o是什么？是你想要的一切

...是语音模式的GPT-4，它更擅长打组合拳，可以接受文字、音频、图像的任意组合输入，然后无缝衔接图文音频的多种形式输出。升级后的GPT-4o回答速度更快了。据OpenAI表示，GPT-4想要实现和人的对话需要通过三步来实现：先把语...……更多

2024-05-14 09:41:00拉蒂,米拉,用户,语音,模型,对话

华为harmonyosnext重塑全新“星盾”安全架构

...的盘古大模型5.0版本，标志着人工智能技术在全系列、多模态、强思维三个方面的全新升级。盘古大模型5.0以其全系列的模型规格，为不同业务场景提供了定制化的解决方案。PanguE系列，拥有十亿级参数，专为手机、PC等端侧智...……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...随着大模型技术日益成熟，vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力，正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级：1、语言大模型升...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

5717元起，谷歌抢发AI手机，压力给到苹果？

...态功能的GeminiNano处理器，可帮助手机理解文本、图像和音频。目前，苹果、三星、谷歌等全球科技大厂都在AI手机上全面发力。在今年6月举行的苹果WWDC大会上，苹果发布了人工智能系统Apple Intelligence（苹果智能），将生成式AI...……更多

2024-08-14 12:25:00元起,压力,苹果,手机,手机,功能

新版ChatGPT在哪些方面“更像人”

...号中的字母“o”代表“omni”（全能），既能接受文本、音频和图像的任意组合输入，还能生成文本、音频和图像的相关回应。该中心不仅围绕GPT-4o做了直播演示，还在社交媒体发布更多视频“炫技”。在一段视频中，GPT-4o听起...……更多

2024-05-16 07:54:00方面,人工智能,人工,智能,演示,研究中心

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代，超级应用是一种集成了多种...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

世优科技携手人民中科打造AI数字人智能体助力智慧校园

...体，接入人民中科研发的“白泽”大模型，使用先进的跨模态智能理解技术，对文本、图像、视频等多种模态信息进行统一理解、统一表达、统一度量，从而实现跨模态生成、跨模态搜索、跨模态对话等功能。 AI数字人智能体...……更多

2024-11-09 09:55:00智慧,数字,智能,校园,人民,科技

推动数智+大健康产业深度融合又一研发总部落子长沙天心经开区

...会现场。单位供图活动现场发布了最新的深思考Dongni.ai多模态搜索引擎、智能终端（AI PC Suite、AI 摄像头、AI 显微镜）、重大疾病早期筛查等重磅产品，并宣布深思考人工智能机器人科技有限公司研发总部正式落户天心经开区。...……更多

2024-10-11 17:04:00开区,长沙,心经,深度,总部,产业

诵读在初中英语教学中的应用策略

...ion？”这一单元的教学时，首先，教师运用多媒体设备的音频功能，播放本节课阅读文本的录音，让学生初步感知阅读文本，了解阅读文本主要讲解的故事内容；其次，教师将学生分为多个小组，并引导小组成员自行分配角色，...……更多

2023-11-06 02:47:00诵读在初中英语教学中的应用策略

快消接入AI引擎丨奥瑞金牵手次世：健康助理“不虚拟” 包装交

...验。尤其是通过运用运动健康领域的AI专属模型，通过对音频、视觉和文本进行推理，在生动的语音对话中，将更加专业、丰富的运动健康理念传递给用户，从而使得犀旺的“运动健康”标签更加有触感。定义新包装、满足新场...……更多

2024-05-24 16:06:00瑞金,接入,助理,牵手,包装,引擎

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表

...Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...刚刚显现，未来还存在巨大的探索空间。第二个是关于多模态理解和生成的统一。在当前「scaling law 撞墙」的相关讨论中，多模态其实是一个被寄予厚望的方向。但是，这个领域目前面临一个严峻的挑战，即多模态的理解和生成...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

中国银河给予传媒互联网推荐评级，GPT-4o免费开放

...性能亮点：1）多模态性能进步明显，GPT-4o打通了文本、音频和图像的输入壁垒；2）语音响应延迟大幅降低，GPT-4o可以在232ms内回应音频输入，平均响应时长为320ms；3）实时语音助手效果亮眼，GPT-4o能够实时翻译，识别表情。投...……更多

2024-06-05 22:17:00银河,中国,传媒,互联网,开放,互联

当AI遇上语音：重塑未来的交互体验

...需求，提升产品体验？近日，「即构科技」发布的自研音频引擎——Purio AI音频引擎，给到市场一个新的解决方案。该方案通过三大核心技术：AI降噪、AI回声消除和音量均衡技术，为用户打造纯净、保真、舒适的听觉体验。不...……更多

2024-11-28 17:45:00语音,体验,语音,用户,技术,能力

2B多模态新SOTA！华科、华南理工发布Mini-Monke

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型，通过采用多尺度自适应切分策略（MSAC）和尺度压缩机制（SCM），有效缓解了传统图像切分策略带来的锯齿效应，提升了模型在高分辨率图像处理和文档理解任务的...……更多

2024-08-13 09:42:00模态,华南,专治,后遗症,理工,分辨率

爱尔眼科数字人“爱科(Eyecho) ”正式发布，支持视频、

...“爱尔名医陪伴数字人”，可支持视频、文本和语音等多模态交互，也即将投入应用。“爱科（Eyecho）”的名字既体现爱尔“创新驱动，科技爱尔”的发展战略，也起英文Echo“回音”之意，蕴含爱尔运用最新的人工智能技术，...……更多

2024-10-26 22:43:00爱尔,模态,眼科,语音,文本,数字

Pika、阿里同日炫技！国产视频大模型奋起直追

...形同步功能Lip sync，可以为视频中的人物说话匹配口型，音频生成部分由AI语音克隆创企ElevenLabs提供技术支持。而就在同一天，阿里推出更炸裂的视频生成框架EMO（Emote Portrait Alive）。两者都有对口型的功能，相比较而言，目前...……更多

2024-03-01 09:26:00阿里,奋起,模型,国产,视频,视频

生成式人工智能新时代

...工业革命的主角。生成式AI是什么？张亚林介绍，文本、音频、图像、视频、游戏生成，跨模态、多模态的生成，虚拟人的生成等，都可以通过各种素材的生成进行互换，这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式...……更多

2023-12-22 00:26:00人工智能,新时代,人工,生成,智能,庆阳

高通aihub正式发布：支持75个ai模型

...另一个多模态AI的演示。这是全球首个在WindowsPC上运行的音频推理多模态大模型，它能理解鸟鸣、音乐或家中的不同声音，并且能够基于这些信息进行对话，为用户提供帮助。例如，多模态大语言模型能够理解用户输入的音乐...……更多

2024-02-27 02:14:00高通,模型,支持,高通,模型,开发者

科学家打造多模态模型，7B和1.3B小模型均开源，可部署手机

...要关注视觉模态和语言模态，但未来计划将其扩展到包括音频和嗅觉在内的更多模态，使之成为一个真正能够与世界连接的智能体。从应用角度来看，这种多模态智能体的潜力几乎是无限的。它们可以成为每个人的超级助理，承...……更多

2024-04-10 10:25:00模型,模态,终端,科学家,科学,手机

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉

【新智元导读】全球首个支持多主体一致性的多模态模型，刚刚诞生！Vidu 1.5一上线，全网网友都震惊了：LLM独有的上下文学习优势，视觉模型居然也有了。来自中国的视频生成模型，再一次震惊了全球大模型圈。生数科技推出...……更多

2024-11-15 09:52:00模型,果仁,上下文,地表,上下,视觉

page 5/1334 首页上一页 1 2 3 456 7 8 9 10 下一页末页

更多关于科技的资讯：

可能叫锐龙9 9955HX：AMD游戏本旗舰U首次现身

快科技12月29日消息，Intel、AMD都在准备新一代高端游戏本平台，其中AMD的代号Fire Range，从桌面版锐龙9000系列移植而来

2024-12-29 21:10:00

AMD的雷霆一击！锐龙9 9950X3D首次现身跑分

快科技12月29日消息，AMD将在CES 2025上发布一大波新品，包括锐龙AI MAX 300系列(Strix Halo)

2024-12-29 22:40:00

CR450动车组揭秘：450公里时速是这么来的

2024年12月29日，CR450动车组样车正式发布，我国新一代时速400公里动车组研制获得重大突破。其中，“CR”是中国铁路英文缩写

2024-12-29 23:10:00

AMD RX 9070 XT功耗超过300W！但拒绝16针供

快科技12月29日消息，AMD的新一代显卡RX 9070 XT、RX 9070将会在CES 2025期间正式发布，预计1月底春节前就会上市

2024-12-29 19:40:00

人类思维的速度竟然只有每秒10比特！这么慢怎么活

互联网数据的传输速度可以用每秒传输的比特数来衡量，单位为bps，如果我们想要不卡顿地进行720p高清视频通话，最少大约需要120万bps（每秒120万比特）的速度

2024-12-29 19:40:00

苏州农商银行举办“锦数杯”数据场景建模大赛

江南时报讯近日，苏州农商银行第二届“锦数杯”数据场景建模大赛在总行多功能会议厅举行。本次大赛以“数据驱动创新，智慧引领未来”为主题

2024-12-29 20:00:00

全球航空一天连发3次事故！阿航空难因客机遭地面攻击、韩国客机

年底了，全球航空业突然重大事故频发，让人心惊肉跳。首先是当地时间12月25日，一架从阿塞拜疆巴库飞往俄罗斯格罗兹尼的阿塞拜疆航空公司客机在哈萨克斯坦阿克套近郊坠毁

2024-12-29 20:10:00

东营：东青“智慧高速”正式启用路更畅行更欢

大众网记者唐梦琳李欣东营报道宽阔平坦、标线清晰的路面，13处并列的通行车道、贴心便捷的服务驿站特色功能……近日，东营市东青高速改扩建项目正式完工启用

2024-12-29 20:59:00

韩国179人遇难客机黑匣子已找到：机长曾发出Mayday信号

12月29日消息，据央视报道，韩国国土部交通部29日下午举行记者会时介绍，事故调查委员会目前已经回收了飞机的两个“黑匣子”

2024-12-29 16:09:00

长安汽车董事长谈本田日产合作：因竞争而走到在一起

快科技12月29日消息，在12月29日的长安汽车伙伴大会上，长安汽车董事长朱华荣谈到了全球车企之间的合作趋势。他指出，传统汽车制造商之间的合作正在加深

2024-12-29 16:09:00

银座新业态抢滩“首发经济”！银座家美惠济宁龙城店开业即爆火

齐鲁晚报·齐鲁壹点许昱洲12月28日，银座家美惠济宁龙城店惊艳亮相，作为银座集团布局济宁市场的重要一环，其新业态、新模式

2024-12-29 16:52:00

三星晶圆代工再遭重创！台积电将独占高通二代骁龙8至尊版订单

快科技12月23日消息，据报道，高通原打算在今年的骁龙8至尊版开始执行双代工厂策略，不过由于三星良品率不稳定等原因，最终让高通选择延后执行该计划

2024-12-29 17:09:00

事故频发！加拿大航空一客机降落遇故障并起火

快科技12月29日消息，据报道，在韩国一架客机遭遇碰撞并起火事件后不久，仅仅相隔两个多小时，加拿大航空公司的一架客机也遭遇了突发事故

2024-12-29 17:09:00

奔驰车标供应商宣布破产：曾经受住了拿破仑入侵、两次世界大战

快科技12月29日消息，据报道，德国的格哈迪塑料技术公司近期宣布破产。这家汽车零件供应商拥有1500名员工，为豪华汽车品牌奔驰生产著名的三芒星标志

2024-12-29 17:39:00

宝骏首款旗舰轿车享境实车亮相：纯电/插混双动力明年上半年上

快科技12月29日消息，宝骏品牌首款旗舰车型“宝骏享境”近日在上汽通用五菱的2024年第80万辆新能源车下线现场正式亮相

2024-12-29 17:39:00

头条订阅服务