• 我的订阅
  • 头条热搜
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对外展示了图像识别数据集ImageNet,...……更多
天和防务:亮相丝博会,算力方向纵深拓展、发展动能愈发强劲
...时,自动将外语转换为中文进行浏览。面向Chorme浏览器的多语字幕同传助手,实时识别语音,自动翻译并展示为双语字幕,助您轻松办公学习和娱乐,无论查阅视频资料、浏览新闻,还是网上购物,为您无缝转换语言,跨越沟通...……更多
出彩临港人 | 推进语言能力建设,助力临港国际化发展
...设,助力临港国际化发展——记上海海事大学临港新片区多语言服务中心团队人民网记者董志雯 实习生李易泽作为临港新片区国际化建设的重要组成部分,上海海事大学临港新片区多语言服务中心自成立以来,始终坚持为国际...……更多
AIGC工具测评:生成式AI的产品表现如何
...5,GPT-4不仅在处理自然语言方面取得了显著提升,而且在多语言处理能力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大拓宽了其应用范围。界面体验ChatGPT-4的...……更多
阿里大模型,再次开源大放送
...到了升级和统一。全系列均统一支持至少32k的最大长度;多语言能力全面提升并提供了更丰富的多语言评测;全系列统一支持systemprompt;统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)02OneMoreThing这两天,与阿里大模...……更多
科大讯飞推出ai录音笔s8离线版,支持多语种转文字
...方零售价为6999元,其采用国密二级独立芯片加密,支持多语种转文字、同声传译,可完全隔绝外部网络使用,内置了256GB存储空间。据IT之家了解,该产品机身无Wi-Fi、蓝牙、SIM卡无线通讯模块,符合机密会议、审讯、任务部署...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...。论文地址:https://arxiv.org/html/2305.14328v2如今,随着LLM的多语言能力越来越强,也让此前鲜有进展的AI翻译赛道,突然卷了起来。早已布局的科技大厂,以及刚刚下场的各路LLM初创,纷纷推出了自家的AI翻译产品。DeepL表示,自家L...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
想象一下当你躺在沙发上,只需要不假思索地说出指令,机器人就能帮你干活,是不是听起来就十分惬意?如今这种科幻电影中的场景正在变为现实,来自北京大学的助理教授、博士生导师董豪团队近日提出首个通用指令导航...……更多
WAIC2025 | 思必驰俞凯谈对话式语言计算与普惠人工智能
...能交互技术正面临标准化与本地化的双重命题。思必驰以多语言大模型为技术根基,正积极携手国际组织及海外合作伙伴,探索“技术适配性+场景普适性”的深度融合路径,这一探索有望将先进的人工智能技术推广至更广阔的...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...L.T),整合了Transformer架构到隐视频扩散模型中。在UCF-101基准上,W.A.L.T取得了最佳的零样本FVD分数,展示了其可扩展性和效率。(来源:“机器之心”微信公众号)《马斯克打造的“叛逆”AI被曝抄袭ChatGPT?xAI工程师回应:我...……更多
初创公司推出全球首个ai软件工程师devin
...号称会彻底改变人类构建软件的方式。Devin在SWE-bench编码基准测试中取得了突破性的成功,展示了其执行复杂任务的能力,甚至超越了顶尖的人类工程师。*Devin是在数据集25%的随机子集上进行评估的。Devin是无辅助的,而所有其...……更多
两个人工智能系统说起“悄悄话”
...究人员开发的人工神经网络模型,展示了AI系统解释语言指令并相应执行任务的能力。在学习并执行一系列基本任务后,其中一个AI系统能够向其“姐妹”AI系统提供这些任务的语言描述,而后者又执行了这些任务。研究中使用的...……更多
以人工智能助力涉外法治建设
...规,可以帮助法律专业人士快速把握异同点。同时,开发多语言法律转换与理解平台,利用自然语言处理技术,让法律文本自动翻译与术语精准匹配,减少因语言障碍带来的误解,可以助力精准决策。 最后,人工智能可以帮助...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...分校计算机科学与技术系特聘教授俞士纶、国际关联数据基准委员会(LDBC)副主席 Alastair Green、中国人寿财产保险有限公司人工智能开发团队负责人孔宇飞、蚂蚁数字科技 AI 技术负责人章鹏、蚂蚁集团图计算解决方案架构师崔...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
...Falcon 和 LLaMA 系列模型作为研究对象,通过实验分析了非指令微调模型(如 GPT)和指令微调模型(如 Flan-T5-large)在 22 个任务(17 个已知的涌现任务和 7 个基线任务)和不同条件下的表现。图|模型列表。为了全面评估模型能力...……更多
“讯飞同传麦克风”全球首发 让多语言会议无障碍沟通
...传麦克风”,致力于打造“听得清、译得准、记得全”的多语言交流体验,为全球用户带来多语言会议的全新范式。指向型麦克风 拾音更清晰全球经济一体化进程加速,跨国协作、国际会议、跨境商务等活动日益频繁,语言障...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在MIT的演讲中,他首先提到:通往AGI...……更多
...,林志成详细讨论了与大语言模型交互时如何写有效的“指令”。文章认为,精心设计的指令不仅可以提高响应的准确性和相关性,还可以避免由于指令质量不佳而导致的模型表现不佳。大语言模型运用深度学习技术模拟人类大...……更多
YouTube会自动识别语言并生成多语种配音版本
...者只需按照常规上传视频,YouTube会自动识别语言并生成多语种配音版本。目前,该工具支持英语、法语、德语、印地语、印尼语、意大利语、日语、葡萄牙语和西班牙语。YouTube的自动配音功能采用了谷歌的Gemini技术模拟人类语...……更多
小语种国家如何拥抱AI 全球专家论道WAIC
...(WAIC)技术方向的重磅议题,“科大讯飞高级别高水平多语言基座大模型国际学术研讨会”在上海举办。研讨会汇聚了来自中国、英国、匈牙利、塞尔维亚、泰国、马来西亚等20多个国家和地区的产学研代表,围绕“共建智能语...……更多
自然语言处理:大模型理论与实践
...自编码,优化参数设置和可扩展训练技术。- 微调:涵盖指令微调概念、构造指令实例的方法和数据集,指令微调任务中的自然语言理解和生成任务,多模态指令微调的数据构造和模型微调方法,以及指令微调优化方法和效果。-...……更多
讯飞双屏翻译机即将首发语音大模型,多语言自动识别重磅亮相
...大模型,讯飞双屏翻译机将首发搭载语音大模型,并上线多语种自动识别和增强式翻译两个重要功能,分别于今年1月底和3月中旬完成软件推送升级,供全部新老用户使用。在旅行等场景下的跨语言沟通中,我们常常不清楚对方...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...都表现出了增强的性能。表 5 列出了各种模型在 Video MME 基准上的表现,比较了它们在短视频、中视频和长视频长度上的有效性以及整体性能。LongVILA-8B 采用 256 帧,总分为 50.5。研究者还在表 6 对第 3 阶段和第 4 阶段的影响进行...……更多
腾讯最强!混元自研深度思考模型T1正式发布:吐字快、能秒回
...E、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到业界领先推理模型的水平。T1还在多项对齐任务、指令跟随任务和工具利用任务中展现出了非常强的适应性。混元T1正式版沿用了混元Turbo ...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的...……更多
...:深圳特区报多种语言服务 还能手语交流深圳银行网点多语言服务获点赞:体现了城市的开放与温度深圳特区报讯(记者 沈勇)近日,有网友晒出在深圳某银行拍到的多语言服务团队公示牌:一个小小团队可以提供英语、手语...……更多
高职榜样 梦响武职丨外语外贸学院:涵养家国情怀,开启“以赛育人”新篇章
...聚焦内涵建设,服务区域发展,致力于英、法、日、德等多语种教育教学工作。学以致用,深化应用外语专业群建设多年来,外语外贸学院深化产教融合、聚焦人才培养。学院围绕立德树人根本任务,结合国际语言服务发展战略...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...员和现有的 Grok 用户推出。在官方测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中竞赛问题。此外,它在评估代码生成和解决问题能力的 HumanEval 基准...……更多
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...度的同时、降低预训练成本,而不会牺牲性能。它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。DeepSeek团队表示,稀疏注意力为提高效率同时保持模型能力,提供了一个有前景的方向。...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00