• 我的订阅
  • 头条热搜
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
...模型算法持续演进,国外以GPT-4o、特斯拉FSD等为代表的多模态端到端方案,已被证实可进一步提升技术效果和用户体验。而讯飞星火极速超拟人交互将此前级联方案升级为统一神经网络,实现语音到语音的“端到端”建模,大幅...……更多
李未可科技正式推出WAKE-AI多模态AI大模型
...科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。 该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
近期,36kr研究院发布了《2024年AIGC行业研究:多模态大模型与商业应用》,文中基于AIGC产业生态现状和技术发展路径,深入分析AIGC商业化应用的方向与产业发展趋势。其中在36kr研究院梳理的产业图谱中,发现杭州李未可科技...……更多
李未可科技创始人茹忆:WAKE-AI,多模态大模型带来的智慧
...论坛中,李未可科技创始人兼CEO茹忆发表了《WAKE-AI:多模态大模型带来的智慧文旅变革》的主题演讲,分享了自己关于人工智能和AI硬件的看法。茹忆指出,随着大模型的不断发展,基于人工智能的交互方式正从单一的语音和视...……更多
中国版GPT-4o 来了,抢先OpenAI落地,8月底全民开放
...框架创新基础上,星火极速超拟人交互目前主要开放语音模态,未来会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。在2023年科大讯飞全球1024开发者节上,华为科技有限公司副董事长、轮...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物理题。现场演示中,对“前进20米、右转60 、反复...……更多
Soul App联手中国美术学院再次发起数字艺术展,以AI创造互动新体验
...语音技术等方面拥有了前沿能力积累。目前,Soul具备多模态情感识别能力的语言大模型 Soul X、语音大模型(包括语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等)均已上线。 值得注意的是,近期,Soul...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
永劫手游搭载首个游戏Copilot!能“听懂人话”的AI队友诞生了
...植入一个游戏特化的百度百科没什么太大区别。但随着多模态、AI大模型技术的不断进步,游戏AI也正朝着更加智能、更加人性化的方向发展。6月19日,永劫手游的“定胜终测”,带着它的全球首个游戏Copilot AI,出现在了玩家们...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
...器人视觉观测和自身状态向量输出运动轨迹,将端到端多模态模型置于模仿学习框架下,并结合数据回收系统,让机器人具备拟人的双臂操作能力。Cyan 青心意创表示,OrcaⅠ 从操作模型、多模态处理能力、数据及传感器等方方...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
Soul上线自研大模型“SoulX”,AIGC+社交布局提速
...据训练,具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力。在保证对话流畅、自然、具备情感温度的同时,SoulX覆盖百种细粒度风险类别,通过训练数据安全筛选、安全SFT数据构造、RLHF安全对齐、推理拦截等策略...……更多
讯飞星火首发智能体平台,敏捷触达大模型应用企业落地最后一公里
...精准,也让智能化辅学更有针对性更高效;也结合本次多模态能力升级了百科问答功能,星火大模型理解并融合了大量图书知识,对于孩子的奇思妙问等复杂问题,“爱因斯坦”和他的大咖虚拟人朋友都能回答,让孩子们在趣味...……更多
讯飞星火V3.5春季上新,有能力更有“温度”
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
讯飞版「Her」横空出世全民开放!百变人设逼真丝滑,情绪价值逆天
...然后通过适配器,将其与文本的语义表征对齐。再通过多模态大模型,去预测生成表征,最后通过音频解码器得到语音。相较于传统语音交互系统,端到端统一模型以知识对齐表征方式,让信息在各个模块之间传递。这意味着,...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...与图像处理于一体的集成化SDK,提供AR视频技术、基于多模态感知与驱动的交互技术和基于重建的虚拟形象技术),持续以AI辅助、重塑社交环节,提升社交的效率和质量。2020年,Soul系统启动AIGC的技术研发工作,并在智能对话...……更多
国内首个端到端语音大模型将上线,人工智能也要有“情商”
...大模型,则相当于一位“心理咨询师”,利用超100TB的多模态心理行为数据深度训练,同时与心理学专业博士、专业心理咨询师进行三维度交叉学科研究,围绕多方面心理疗法持续学习,确保其在心理咨询服务中的专业性。这款...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
讯飞星火V4.0整体超越GPT-4 Turbo,8个国际权威测试集测评第一
...但具备了多语种多方言的“自由交互”,还具备多情感多模态的超拟人交互,让人车交互更有温度。当前,讯飞语音交互产品国内市占率稳居第一,同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
讯飞星火首发AI合同助手,大模型时代的“超级知识助手”来了
...均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。 但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道...……更多
北京,冲刺人形机器人第一城
...智能前沿核心技术,率先研制出国内领先、国际先进的多模态具身大模型和多形态机器人;打造一批具身智能标杆应用示范,率先实现具身大模型在万台机器人上的融合应用。 今年8月,石景山区发布《石景山区人形机器人产业...……更多
更多关于科技的资讯:
杭州六小龙 第一个IPO即将诞生
继 DeepSeek 和宇树科技之后,又一家来自杭州的科创企业群核科技于近日走到台前,迎来了关键时刻。近日,群核科技递交了港股招股书
2025-02-26 19:05:00
禁止电竞选手2月23日洗澡冲上热搜!到底什么情况
快科技2月26日消息,今天下午,微博热搜上出现了一个看起来颇为奇怪的词条“禁止电竞选手2月23号洗澡”,并且一度冲上了第一的位置
2025-02-26 19:05:00
RTX 50/40/30大量黑屏变砖!救命的BIOS、驱动来了
快科技2月26日消息,RTX 50系列发布之后,不少玩家遇到了黑屏、变砖的问题,无法再点亮,不仅波及RTX 5090(D)
2025-02-26 19:05:00
汽车应急车道违停 被一只半挂轮胎追尾 司机懵了
快科技2月26日消息,近日,杭州公安高速交警接到一起奇特的车辆报警。一位驾驶员称自己停在应急车道的车子,竟被一只轮胎“追尾”了
2025-02-26 19:05:00
曾为驾驶爱好者白月光!新款别克君威GS实车展示
快科技2月26日消息,曾几何时,别克君威GS还是很多年轻人梦想中的运动型家用车,然而随着新能源的到来,2.0T高性能发动机已经无法满足他们的胃口
2025-02-26 19:05:00
响应小于1秒、唤醒识别超98%!岚图自研AI语音对话系统即将发布
快科技2月26日消息,岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力
2025-02-26 19:05:00
国补政策落地“满月”,点燃十堰数码产品“换新潮”
十堰广电讯(全媒体记者 蒋巍)自1月20日起,手机等3C数码产品购新补贴政策正式实施,“国补”政策落地满月,十堰的数码产品销售市场态势如何?数码产品迎来换新潮2月25日
2025-02-26 19:24:00
三星计划2030年实现1000层NAND!使用长江存储专利技术
快科技2月26日消息,随着NAND闪存技术竞争日益激烈,三星电子公布的路线图显示,计划到2030年开发出1000层的NAND闪存
2025-02-26 19:35:00
ROG魔盒WIFI7电竞路由器首发1999元:9个2.5G网口
快科技2月26日消息,华硕带来了ROG魔盒 WIFI7电竞路由器。首发到手价为1999元。ROG魔盒 WIFI7电竞路由器机身融入了大量ROG元素
2025-02-26 19:35:00
旅游公司招募太空旅行者:门票一人400多万 近两年席位已售罄
快科技2月26日消息,据媒体报道,近日,在湖北一商场内,一家旅游公司悬挂出太空旅行的乘客招募广告。该广告宣称,这场太空旅行面向普通市民开放
2025-02-26 19:35:00
DeepSeek凭借其开源、低成本、高性能等优势,掀起人工智能领域的新一轮热潮。作为平安集团金融科技生态圈的重要组成部分
2025-02-26 19:44:00
股价暴涨4倍后,博士眼镜实控人再减持,“AI眼镜第一股”含金量如何?
博士眼镜股价暴涨但业绩下滑,欲靠加盟拓展门店? 来源|时代商业研究院作者|陈佳鑫编辑|韩迅【导语】AI眼镜是人工智能最热门的赛道之一
2025-02-26 20:02:00
男子在高速上恶意别停他车 还威胁辱骂女司机让网友看怒:官方通报
2月26日消息,近日,有网友发视频称,重庆高速上一男子开丰田车在高速上恶意别停后车,并且还辱骂后车女司机。按照女司机的陈述
2025-02-26 20:05:00
游戏本天花板!微星泰坦18 Ultra AI/龙魂典藏版发布:满血RTX 5090、96GB大内存
快科技2月26日消息,在今天的新品发布会上,微星正式发布了泰坦18 Ultra AI和龙魂典藏版旗舰游戏本。核心配置上
2025-02-26 20:05:00
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
开源模型,还是得看杭州。前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型Wan 2.1,14B参数直接屠榜VBench
2025-02-26 20:05:00