• 我的订阅
  • 头条热搜
如何让AI精确识别讽刺语言?新多模态算法应运而生
...义,来自荷兰格罗宁根大学的一个研究小组推出了一种多模态算法,这套算法能够提升AI理解讽刺语句的含义。以往AI技术检测语言内容是否具有讽刺含义时,只会基于单个参数进行识别,但如今研究表明这样的算法并不可靠,...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...面,当前业内提及大模型,更多指的是大语言模型,其他模态的大模型数量不多。360认为,增强多模态能力,核心要借助大语言模型的认知、推理、决策能力。于是,此次360智慧生活决定将视觉感知能力与360智脑大语言模型相结...……更多
小红书布局大模型:多媒体算法负责人牵头、上线AI绘画应用 | Long China 50独家
...负责AI和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。除了成立大模型团队以外,36氪了解到,小红书内部还有多个独立部门同时推进AIGC方向的落地探索。今年4月份,小红书...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...低。当地时间3月14日,ChatGPT开发商Open AI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4“给它看张草图,一秒生成网站”的惊人表现被称为“王炸”产品。GPT-4发布后,A股市场的ChatGPT概念股并没有延续数月前的疯...……更多
...1亿美金。资金主要将用于核心研发团队的建设,加速多模态大模型和应用产品的研发。成立于2023年3月,生数科技由安全可控人工智能方案提供商瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化,聚焦于多模态生成式大模型与应...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
本文转自:科技日报新算法实现人工智能多模态信息“去伪存真”科技日报讯 (记者史俊斌)记者5月18日从西安电子科技大学获悉,由该校计算机科学与技术学院教授赵伟领衔的智能媒体计算机团队,通过数据可信重建以及弱...……更多
海天瑞声宣布开源多模态数据集,布局全栈式自动驾驶数据平台
...消息,AI训练数据服务商海天瑞声CEO王晓东宣布将开放多模态数据集,推进数据资源整合共享。据介绍,此次即将开源的多模态数据集「DOTS-MM-0526」涵盖图像、语音、文本等多个维度,开源数据集可以帮助各领域的研究者和开发...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
... 2024“人工智能+”标杆示范征集活动。联汇科技凭借在多模态大模型与智能体行业的突破性技术创新,以及在细分市场中的卓越表现,荣获2024人工智能隐形冠军企业标杆Top10。联汇科技拥有卓越的技术能力,其核心技术包括向量...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新突破,其卓越的图文跨模态开放任务处理能力可...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...参数量将以指数级的速率提升,另一方面是数据量随着多模态的引入也将大规模增长。不过,徐立提到,虽然目前业界训练模型对基础算力、基础设施的需求非常旺盛,但基础算力里对并行效率的要求非常高,真正好用的基础设...……更多
东方通:机器视觉领域拥有基于深度学习的多模态内容识别算法
东方通在互动平台表示,公司在机器视觉领域拥有基于深度学习的多模态内容识别算法的内容安全监测系统,具备对文本、图片、视频、语音、深度合成内容等的识别能力。 ……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔
...办公、法律、医疗有望率先落地。东方证券:谷歌发布多模态模型Gemini,多模态应用前景广阔12月6日晚,谷歌正式发布了Gemini大模型,是谷歌目前最强大最通用的模型。其尺寸最大的版本GeminiUltra在32项基准测试中有30项能力都超...……更多
“大模型”时代 路凯智行如何Rock AI
...型,随着近几个月SORA的横空出世,融合语言与视觉的多模态模型也已初露峥嵘,但目前市面上的通用大模型并非“万金油”,面向垂直领域内的各类生成式AI应用还需要结合场景需求积累数据和构建定制化的模型。矿山无人驾驶...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...。大会上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
“解锁”AI云盘新体验!中国移动云盘通过3项AI算法备案
...中,中国移动云盘3项大模型算法成功通过备案,涵盖多模态大模型、文本生成算法等。去年9月,中国移动云盘启动AI智能工具内测,本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务,在国内AI云盘赛...……更多
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...ATO大模型算法和讯飞星火认知大模型算法之外,阿里的多模态算法达摩院交互式多能型合成算法也在列。受到这一消息刺激,AI概念股午后突然发力,其中科大讯飞一度涨逾8%再创新高,而神州泰岳一度涨超13%,万兴科技、彩...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
...型价值的唯一标准,旷视科技也会从视觉大模型向通用多模态大模型进军。大模型未来要靠“两条腿”走路唐文斌表示,多模态大模型是通向AGI(通用人工智能)的必由之路。大模型是当前AI最重要的技术发展方向,它让AI技术走上...……更多
「虎博科技」发布自研多模态大模型TigerBot,开源模型、代码及数据 | 36氪首发
作者 | 邓咏仪编辑 | 苏建勋36氪获悉,6月7日,虎博科技正式发布并开源其自研大模型TigerBot。同时,虎博科技还发布了大模型应用开发所需的全套API,以及多领域专业数据。虎博科技成立于2017年,是一家专注于深度学习及NLP(...……更多
用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线
...展的指令规范,调用其他模型的API和第三方工具,弥补单模态对话模型的局限性。AquilaChat的文字对话能力。图源:智源比如仅靠AquilaChat无法实现文生图的功能,但是靠调用智源开源的文生图模型AltDiffusion,就能弥补文字模型”...……更多
地平线旭日️X3派语音算法通过Alexa ACM认证
...,通过打造完整的语音交互方案为客户提供业内领先的多模态语音交互算法模块——包括声学前端、语音识别、自然语言处理、语音合成、车载无麦K歌,并且率先推出车载四音区、多模命令词,和具有良好泛化性的多模态离线...……更多
更多关于科技的资讯:
“数聚江宁 数领未来”论坛在宁举办多措并举,亮出“数据强基”组合拳南报网讯(记者孙秉印通讯员何俏闵子豪)第九届未来网络发展大会“数聚江宁数领未来”论坛昨天在江宁召开
2025-08-21 08:16:00
●黄伟伟鼓浪屿、园博苑等景区游人如织,演唱会、小剧场一票难求,博物馆、科技馆门庭若市,毕业游、亲子游不断升温……厦门,为火热的暑期文旅经济再添一把“火”
2025-08-21 08:31:00
厦门外贸优品秀出硬实力 创意快闪活动在高崎机场启幕
体育器材企业参与快闪活动,图为工作人员向旅客介绍产品。 (厦门日报记者 卢剑豪 摄)厦门网讯 (厦门日报记者 吴晓菁)18日
2025-08-21 08:31:00
近日,国家广播电视总局印发实施《进一步丰富电视大屏内容 促进广电视听内容供给的若干举措》。《若干举措》强调,要多措并举加强内容建设
2025-08-21 08:39:00
厦门网讯 (厦门日报记者 何无痕)前天,福建省首届“青春之歌”创业创新大赛厦门选拔赛举行,经过激烈角逐,“高精度大功率激光精密制造机器人研发及产业化”“智剪工坊——AI 直播切片
2025-08-21 09:02:00
“新区外贸何以逆势增长”系列报道①丨沂河新区企业“出海”记
当下,“出海”已成为中国制造企业的核心关键词——这不仅是扬帆远航的必然方向,更是转型升级的必由之路。在此背景下,沂河新区交出的外贸答卷尤为亮眼
2025-08-21 09:14:00
汽车地毯的“绿色密码”:坤泰股份用创新编织低碳未来
大众网记者 王瑜 摄影 胡斌 通讯员 刘丽丽 烟台报道在全球积极践行绿色发展理念、大力推进“双碳”战略的当下,各行各业都在探索绿色低碳转型之路
2025-08-21 09:51:00
民宿托管如何稳定收益?旭客用组合拳拆解空置率
很多房东都有这样的困扰:做日租,旺季像“爆单”,淡季却惨淡;做长租,收益总觉得低了一截;想做短租,频率又不稳定。其实,问题不在房子
2025-08-21 10:11:00
伴鱼成立十周年,创始人黄河发布内部信:打造极致的个性化教育
2025年8月20日,在线教育领域的知名企业伴鱼迎来了其成立十周年的里程碑时刻。在这个具有特殊意义的日子,伴鱼创始人兼CEO黄河发布了以“Evolving Speed is Everything”(进化速度决定一切)为核心的全新主题
2025-08-21 10:21:00
满足“健康”与“美”的时代新需求 稳健医疗荣膺2025“西普金奖”
2025年8月16日-21日,中国健康产业(国际)生态大会(英文缩写CPEO,以下简称西普会)在海南博鳌拉开帷幕。本届峰会以“快蜕变
2025-08-21 10:50:00
8月20日,喜临门(603008.SH)发布2025年半年度报告,上半年公司实现营业收入40.21亿元,同比增长1.59%
2025-08-21 10:52:00
从工业端到消费端 智能机器人加速融入生活
编者按:IFR(国际机器人联合会)最新数据显示,2024年中国机器人专利申请量占全球总量67%,人形机器人的运动控制与灵巧操作技术取得关键性突破
2025-08-21 11:05:00
中国特许加盟展2025全年展会收官 见证加盟浪潮的回归与新生
随着8月10日第65届中国特许加盟展在上海的落幕,中国特许加盟展2025全年展会圆满收官。今年的中国特许加盟展现场,再次见证加盟浪潮的回归
2025-08-21 11:12:00
在8月15日国务院新闻办举行的新闻发布会上,国家统计局相关负责人介绍,我国新质生产力正稳步发展,为高质量发展注入了源源不断的新动能
2025-08-21 11:37:00
滴滴私家车车内除臭添高性价比方案,捷茜曼技术+价格双优势破解异味难题
网约车市场持续火热,滴滴出租私家车作为大众出行的重要选择,车内环境的洁净度与舒适度愈发成为乘客评价的关键。长期以来,车内异味问题——食物残渣发酵味
2025-08-21 12:02:00