• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
Soul App联手中国美术学院再次发起数字艺术展,以AI创造互动新体验
...语音技术等方面拥有了前沿能力积累。目前,Soul具备多模态情感识别能力的语言大模型 Soul X、语音大模型(包括语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等)均已上线。 值得注意的是,近期,Soul...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
永劫手游搭载首个游戏Copilot!能“听懂人话”的AI队友诞生了
...植入一个游戏特化的百度百科没什么太大区别。但随着多模态、AI大模型技术的不断进步,游戏AI也正朝着更加智能、更加人性化的方向发展。6月19日,永劫手游的“定胜终测”,带着它的全球首个游戏Copilot AI,出现在了玩家们...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
【新智元导读】Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味...……更多
讯飞星火V3.5春季上新,有能力更有“温度”
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...然后通过适配器,将其与文本的语义表征对齐。再通过多模态大模型,去预测生成表征,最后通过音频解码器得到语音。相较于传统语音交互系统,端到端统一模型以知识对齐表征方式,让信息在各个模块之间传递。这意味着,...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专业博士、专业心理咨询师进行三维度交叉学科研究,围绕多方面心理疗法持续学习,确保其在心理咨询服务中的专业性。这款...……更多
“百模大战”,国产 GPT 大全
...om/紫东太初紫东太初是中国科学院自动化研究所研发的跨模态通用人工智能平台。实现了图、文、音三种模态的统一表达,以图生音,以音生图,将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。现已...……更多
中国石油发布700亿参数昆仑大模型建设成果
...数从330亿升级到700亿,自然语言处理、语音视觉识别、多模态交互、科学计算等专业能力大幅提升;视觉大模型训练数据进一步丰富,新增的岩石识别功能有效提升了地质研究智能化水平;新训练的160亿参数多模态大模型为“人...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
更多关于科技的资讯:
iQOO Neo10 Pro登榜首!安兔兔公布11月3000元档手机性价比排行榜
快科技12月4日消息,今日安兔兔公布了11月3000档手机性价比排行榜,上月刚刚发布的iQOO Neo10 Pro以816
2024-12-04 10:08:00
买二手车被调表20多万公里 车主:抖音看到线下买的
快科技12月4日消息,众所周知,二手车市场水很深,甚至连不少专业人士都能看走眼,因此当场验车、仔细检查购车合同非常有必要
2024-12-04 10:08:00
中国汽车芯片联盟发布白名单2.0:超1800款产品、高端依旧短缺
快科技12月4日消息,近日,中国汽车芯片产业创新战略联盟发布第二批汽车芯片白名单(以下简称白名单2.0)。据介绍,为了减少上下游验证成本和周期
2024-12-04 10:08:00
电瓶车终于安全了!比亚迪、台铃合作:研发车电同寿电池
快科技12月4日消息,日前,在台铃2025旗舰新品发布会上,台铃与比亚迪宣布达成全球战略合作。双方将共同研发实现车电同寿的全生命周期比亚迪电池
2024-12-04 10:08:00
真我Neo7证件照出炉:不规则镜头模组史无前例
快科技12月4日消息,即将发布的真我Neo7证件照公布,采用了前所未有的不规则镜头模组。根据入网的证件照来看,真我Neo7手机背面的左上角有一个矩形的摄像头模块
2024-12-04 10:38:00
强得飞起!华为Mate X6系列开售:12999元起
快科技12月4日消息,今天上午10:08,华为Mate X6系列正式首销。这次华为Mate X6系列共推出了两款,分别是Mate X6
2024-12-04 10:38:00
何刚亲自交付:十年Mate老用户抢到全国第一台Mate 70系列
快科技12月4日消息,今天上午10:08,华为Mate 70系列正式首销。华为终端BG首席执行官何刚现身华为旗舰店·深圳万象天地
2024-12-04 10:38:00
马斯克称纯视觉方案才是自动驾驶的未来:国内车企坚持激光雷达 更安全
快科技12月4日消息,近日,特斯拉CEO马斯克近期再次公开批评激光雷达,称其为“错误的解决方案”,又一次引起了网友的热议
2024-12-04 10:38:00
本文转自:人民网近日,第七届全国智能科技法治论坛在北京举行。本次论坛由北京理工大学法学院主办,智能科技风险法律防控工信部重点实验室承办
2024-12-04 11:04:00
谁说这豆在中国没人吃的啊:这豆可太棒了!
鹰嘴豆,一种在国内很陌生、但国外很常见的豆子。最近几年开始频繁地出现在很多健身博主、养生达人的食谱里。如果你还没吃过,真的强烈推荐大家试试~因为鹰嘴豆不仅口感香甜
2024-12-04 11:08:00
2049元起!蓝戟三款Intel Arc B580显卡预售:3个DP 2.1接口
快科技12月4日消息,代号为Battlemage的Intel第二代锐炫B系列独立显卡已正式发布,合作伙伴蓝戟的三款新品已在京东开启预售
2024-12-04 11:08:00
比亚迪锂电池成香饽饽 宗申也要用:多款电三轮蓄势待发
快科技12月4日消息,继台铃之后,宗申动力也要使用比亚迪锂电池,首批7款电动三轮车即将上市。宗申动力称,比亚迪锂电池拥有6大核心优势
2024-12-04 11:08:00
小米相机部大佬离职影响手机功能?小米方回应
近日,网传“小米相机部大佬离职,影响小米手机功能”。12月3日,小米集团公关部总经理王化发文辟谣。王化表示:“能说出这样话的人
2024-12-04 11:09:00
牵手App红娘“专业辅助”,助力线上交友更高效
在信息通讯技术日新月异的今天,互联网已经深刻地改变了我们的生活方式,其中最为显著的变化之一便是社交方式的多样化。年轻人的在线交友行为不再局限于传统的社交软件
2024-12-04 11:17:00
研究人员开发出可随时随地监测血压的可穿戴贴片
加州大学圣迭戈分校的研究人员开发出一种新型可穿戴超声贴片,用于连续、无创血压监测。 该设备是首个在 100 多名患者身上经过严格
2024-12-04 13:36:00