• 我的订阅
  • 头条热搜
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...Visual Question Answering, VQA)任务要求模型根据输入的图像和自然语言问题生成自由形式的回答。由于没有唯一的标准答案,评估 VQA 具有很大的挑战性。传统的 VQA 方法主要集中于图像中可见元素的直接查询,而不涉及图像中嵌入...……更多
PC产业驶入创新超车道,英特尔蓉城撬动AI新引擎
...了融合混元AI基座的“小宝AI助手”,其利用深度学习和自然语言处理技术,精准把握用户需求,提供个性化服务和智能推荐,凭借端云一体化,拥有知识获取新效能、智能辅助探索游戏在玩新体验以及对话式推荐定义应用分发...……更多
...味着开源大模型终于追赶上了闭源大模型。这位长期研究自然语言处理的学者说,自从OpenAI在2020年发布不开源的GPT-3以来,这家标榜“从事开放性人工智能研究”的机构就背离了初心。如今,随着深度求索公司的异军突起,大模...……更多
牛津团队提出多年生DToU方案,能有效检查应用程序的使用请求
...且当应用程序生成输出数据时,相应的派生 DToU 会被自动推理出来,和输出数据相关联。而这个派生的 DToU 要考虑计算中对数据的组合和变换,在原有的 DToU 基础上进行自动调整。研究中,课题组也同时回顾了已有的 DToU 语言的...……更多
“大模型”时代 路凯智行如何Rock AI
...在2018年谷歌推出BERT的时候,那崇宁博士就断定未来5年在自然语言处理领域内会实现一个通用的人工智能,只会在自然语言处理这个领域里面实现通用的人工智能。站在2024回看过去,时间证明了那崇宁博士的预测。 那崇宁博士...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...l-based Inverse Multi-agent Planning)。相比之前的方法,LIMP 使用自然语言而不是符号表示来提高通用性,并且能够利用任何预训练的大型语言模型,而 BIP-ALM 则要求开放权重的大型语言模型。 ……更多
智能机器人展团:人形机器人“TA”会取代“我”吗? 扫码阅读手机版
...机器人有望发展成为代理人类行为的智能体。”天津大学自然语言处理实验室负责人、天津市“一带一路”联合实验室语言智能与技术中外联合研究中心主任熊德意告诉记者,过去,人形机器人在“大脑”(软件)方面存在严重...……更多
2000亿“券茅”放大招!开年来近百只基金大额申购解禁
...清单》中,东方财富相关备案共有五个,分别是东方财富自然语言合成算法、东方财富智能对话系统算法、东方财富虚拟主播数字人合成算法、东方财富公告内容提取算法、东方财富图片生成算法。其中东方财富自然语言合成算...……更多
「衔远科技」,以ChatGPT助企业数智化创新
...导清华大学电子系协同交互智能研究中心,拥有二十多年自然语言生成、对话与交互式人工智能的研究经验,他2016年提出的自注意力融合多头机制的自然语言表征机理是Transformer架构的核心思想之一,被Transformer、GAT等论文引用...……更多
以人工智能助力涉外法治建设
...握异同点。同时,开发多语言法律转换与理解平台,利用自然语言处理技术,让法律文本自动翻译与术语精准匹配,减少因语言障碍带来的误解,可以助力精准决策。 最后,人工智能可以帮助提升法律专业能力。当前,由于缺...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
一年多前,ChatGPT初露头角,其突破性的自然语言交互能力撼动了整个世界。之后十几个月,Transformer架构和大语言模型LLM成为划时代的技术,激发了整个AGI领域的创业和创新。OpenAI和Google相继推出了GPT-4o、ProjectAstra等「AI全家桶...……更多
图结构转文本序列,大模型直接读懂!图推理性能大涨
...的线性token序列。belike:这种最新图线性化方法,反映了自然语言中局部依赖性和全局对齐性两个关键属性,即:不仅需要保留基于前文上下文预测下一个token的能力(局部依赖性),而且不同图的token序列应该从具有相似特征的...……更多
高考过后,看“AI+教育”发展方向
...固定的结构与规则,所以这些数据驱动的AI在理解和生成自然语言方面表现尚可。但对于数学、物理等学科,需要AI对数理概念、公式、推理甚至物理世界有深入的理解,并涉及到考题中干扰项识别等多种因素的影响,很大程度...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...智谱就“自研以明志”,从数据到训练集群运维再到核心算法,都实现了全方位的自研。在视频生成领域,智谱自研的视频理解模型用于为视频数据生成高度吻合的文本描述,进而构建了海量的高质量视频文本对,使得训练出的...……更多
...言、视觉、预测三方面能力。其中,语言交互与生成支持自然语言问答,用户能通过对话调用系统功能、查询知识库或生成可视化报表等;视觉识别与分析可对图像、视频进行多维度分析,涵盖行人特征识别、动作行为检测、产...……更多
由厦门市人民政府主办的第五届中国人工智能大赛正式启动
...。本赛题要求参赛者提供人工智能模型接口,根据给定的自然语言描述或伪代码,生成功能正确、语法规范且可读性强的程序代码。本赛题将设置100道题目,按照难度分为三个层次梯度:初级、中级和高级。初级题目主要测试基...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 和 ChartQA,它们不仅需要理解,还需要对图表进行强大的推理能力。对于这两个基准,PaLI-3 稍微落后于 PaLI-X。另外,研究人员还扩展了 PaLI-3 的功能,使其能够通过语言类似的输出来预测分割遮罩。实验结果表明,对于这种类...……更多
AI巨头燃起创新之火,人形机器人走入家庭提上日程?
...频模型的进步,使人形机器人具备更高的事物处理能力和自然语言交互能力,由此为机器人产业发展提速;另一方面,科技巨头纷纷入场和重磅加码,进一步加速人形机器人产业落地。 近日,在微软研究院发布的关于Sora的深度...……更多
...这些模型通常具有高度的通用性和泛化能力,可以应用于自然语言处理、图像识别、语音识别等领域。此前我国多家企业和机构已经发布了大模型产品并进行了小范围内测,此次开放服务的大模型也意味着它们通过了相关部门备...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
...得比基准模型要差。研究人员推测,让大型语言模型适应自然语言对话可能会阻碍其科学推理能力。按子领域和参与者类型划分时,大型语言模型在每个子领域中的表现也都优于人类专家。在测试时,为了防止基准测试本身可能...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...例如,OCRBench)的性能,但与低分辨率版本模型相比,在推理相关任务(例如,MMMU)上的准确率却会下降。此外,虽然开源的多模态大模型在视觉-语言任务上取得了非常亮眼的基准测试结果,但在纯文本任务上的性能却有显著...……更多
智启新元年:PC成为AI落地首选终端
...以使用语音、触控、文本、姿态等多种形式与计算机进行自然语言对话,而不仅仅局限于特定的命令或语法。其次,AI PC标配异构混合(CPU+NPU+GPU)算力,传统进行通用计算的CPU通过架构创新、集成专为神经网络工作负载进行...……更多
汽车机器人的能力:自然交流、自由移动、自我成长
...的“终极战争”是什么?我们认为,未来在智能化阶段,算法、算力、模型、AI等方面的核心竞争力会逐渐产生迁移。我们认为,大模型其实是整个未来技术生态最重要的OS,当我们把这么多AI的能力包括技术的生态接入到车里,...……更多
马化腾:有所为,有所不为
...门设立AI技术委员会,关注领域包括但不限于AI大模型、自然语言处理(NLP)、光学字符识别 (OCR)、图像识别、推荐算法、深度学习训练和推理等。此外,在相关规范中也新增人工智能相关数据处理要求,保证可以实施全面的数...……更多
人工智能应用场景不断拓展
...后做到全场景、全任务。“同时,它还要能够跟人之间用自然语言沟通,不仅能干活,还能交流”。宇树科技创始人、首席执行官王兴兴认为,明年机器人将更多地出现在工业场景。再过3年左右的时间,全球范围内将会出现更...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
...LM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失任何一个战略性风口,否则就会被时代甩下。vivo对大模型的布局初心也只是想抓住人工智能这个趋势,以免自己被...……更多
Find X7正式发布!天玑9300带来极致性能
...。FindX7的超光影图像引擎还集成了全面升级的超光影图像算法与自然色彩算法,通过与天玑9300的第九代Imagiq影像处理器的深入配合,让FindX7带来色彩与光影的丰富变化与层次,复刻出哈苏影调的高级表现力。OPPOFindX7展示了生成...……更多
...效削减,实现了显著的效率提升,相关研究成果已被国际自然语言处理领域顶级会议COLING24接收。据介绍,SmartTrim技术的核心在于其自适应剪枝能力,通过分析模型中每层的token表示和attentionhead的冗余性,智能识别并剪除不必要...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作; 理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言...……更多
为什么DeepSeek回答前总先“嗯”一下
...其实藏着人工智能理解人类语言的独特逻辑。01模拟人类自然语言习惯人类对话中,语言从来不只是信息的搬运工。中国社会科学院语言所的研究者们曾对日常会话进行过分析,统计口语会话中“嗯”“啊”类话语标记出现的次...……更多
更多关于科技的资讯:
鲁网12月1日讯泰安联通聚焦精品网络建设核心,持续深化云网融合能力、优化网络运维体系、升级服务保障机制,为区域数字经济发展筑牢通信底座
2025-12-01 13:35:00
冬日有暖意 服务联万家——泰安联通客户日打造贴心服务体验
鲁网12月1日讯初冬时节,寒意渐起,但服务的温度却未曾缺席。近日,泰安联通在全市各营业厅成功举办“联通客户日暖冬回馈季”主题活动
2025-12-01 13:37:00
王倩:以“法律+”思维,护航企业破局新生
巾帼不让须眉:年轻有为的破产破局者,王倩用专业赢得信任当企业陷入债务泥潭,当债权人与债务人的利益激烈碰撞,当投资人寻求危局中的机遇——破产业务从来不是简单的“清算注销”
2025-12-01 09:25:00
重塑健康增长范式,米连科技或将引领互联网发展新路径
在互联网行业经历深刻变革的今天,追求健康、可持续的增长模式已成为企业生存发展的关键。米连科技通过其独特的战略路径,向业界展示了一条超越“烧钱换规模”传统逻辑的新型发展道路
2025-12-01 09:55:00
《和平精英》地铁逃生「冰雪危途」全新赛季火热开启,这把雪赚到底!
列车一响,雪赚开场!《和平精英》地铁逃生全新赛季「冰雪危途」,11月29日,邀你雪赚启航!用创新玩法,拓宽地铁逃生摸金搜打撤的边界
2025-12-01 09:55:00
邮储银行唐山市分行以“政策落地+精准赋能”为主线,积极构建专业化科技金融服务体系,全力支持新质生产力发展。该行创新推出“网点深耕+全链服务”模式
2025-12-01 10:02:00
近日,人保财险唐山燕新路营销服务部组建专项服务小组,走进公司周边场所,开展“面对面、零距离”客户服务行动。活动现场,工作人员以客户需求为导向
2025-12-01 10:06:00
信息技术的迅速发展,尤其是大数据的广泛应用,正在推动医保体系发生深刻变革。传统的医保支付方式已经难以适应现代医疗服务的复杂性与多样化需求
2025-12-01 07:04:00
“一上午加了8位境外采购商”
本报讯(全媒体记者陈春伟、实习生罗家骏)“嘀”的一声,江西华昌竹业集团有限公司外贸经理严慧的微信好友列表里,又多了一位国际采购商
2025-12-01 07:05:00
11月16日,一艘装载邢台纳科诺尔精轧科技股份有限公司生产的辊压分切一体机的货轮,从天津港环球滚装码头启航驶往海外。至此
2025-11-30 07:36:00
坚定信心 勇挑大梁·产业新亮点丨“能址星图”如何全省率先把数据“变现”?
10月18日,在2025中国国际数字经济博览会上,秦皇岛市大数据有限公司展示“能址星图”数据产品。 石 勇摄“我们的‘能址星图’产品上架两三个月时间
2025-11-30 07:37:00
重磅!鸣望教育签约英国子午线英语,解锁中英教育合作新范式!
2025年11月20日,鸣望教育行业赋能第27届研讨峰会,达成一项重磅签约。鸣望教育与拥有46 年专业积淀的英国子午线英语学校(Meridian English)正式达成战略合作
2025-11-30 12:05:00
新生态、新平台、新增长|鲸鸿动能数智赋能品牌确定性增长
2025年,中国消费市场的竞争正从流量红利的浅层博弈,迈向以生态力为引擎、深度运营为核心的新阶段。在这一关键转折点,鲸鸿动能于11月28日成功举办“鸿蒙商业增长论坛·品牌营销沙龙”
2025-11-30 12:05:00
全运会宣传中惊现AI MV:谁在用算法谱写湾区之声?
第十五届全国运动会于11月21日圆满落下帷幕。记者从组委会了解到,一首全程由AI生成的原创宣传MV《向着光的方向》已被正式收录进本届赛事的官方宣传素材库
2025-11-30 12:06:00
华为Mate 80等新品发布,华为音乐「音乐助手」一键生成专属歌单
11月25日,华为Mate 80系列 | Mate X7及全场景新品发布会在深圳举行,华为音乐作为鸿蒙6自有应用重磅升级
2025-11-30 12:07:00