• 我的订阅
  • 头条热搜
ChatGPT爆火到休克,问它北大好还是清华好,它还挺圆滑
...都基本说到点了,还挺谦逊,也足够圆滑,比如我问他“北大好还是清华好?”他说这是一个相当有争议的问题,因为没有明确的答案。看来给ChatGPT打工的北大清华学子数目相当。不过ChatGPT要达到电影《她》里那个电话机器人...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...lu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼成的?Ai2 在预训练语言模型的基础上,通过四个阶段的后训练方法生成 Tülu 3 模型(见图 1)。这套训练流程结合...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...模型在短短一年时间内就取得了令人瞩目的进展,在多个基准测试中展现出了优于GPT-4的能力,尤其是在代码开发、科学推理等场景中的卓越表现。更重要的是,Claude在安全性方面表现出色,能有效防止大模型”越狱”(突破安全限制...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
...本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本大模型经过多年的发展,逐渐发展成了统一的纯解码器Transformer架构。反观现有的多模态大模型架构仍然处于混乱状态,...……更多
谷歌版Sora升级4K高清!一句话控制镜头运动,跑分叫板可灵海螺
...评估中,Veo 2 的表现优于其他领先的视频生成模型在Meta基准数据集 MovieGenBench上,人类参与者观看了1003个提示和响应的视频。结果显示,跟市面上的主流视频生成模型相比,Veo2.0在整体偏好、Prompt指令准确遵循方面都表现最佳...……更多
...标相结合的方法,全面评估模型的性能,确保其在理解和生成古汉语文本方面的有效性。 二、古汉语大语言模型的应用古汉语大语言模型的应用前景广阔,涵盖文化传播、教育培训、学术研究等多个领域。在文化传播方面,古...……更多
MSRA:视觉生成六大技术问题
文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉信号拆分是最本质的问题。生成模型的目标是拟合目标数据分布,然而,目标数据分布过于复杂,...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。除此之外,在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...性消息——结果没多久,Reflection 70B就被打假了:公布的基准测试结果和他们的独立测试之间存在显著差异。无论是AI研究者,还是第三方评估者,都无法复现Matt Shumer所声称的结果。根据Artificial Analysis的数据,Reflection 70B在基准...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...AR和NAR模型的结合。以文本序列和代码提示<′,0为条件生成目标代码≥′,0的第一代码序列,再用自回归的方式生成每组的目标代码。给定≥′,0序列后,就可以使用文本条件和声学条件<′推断NAR模型,以生成剩余的目标代...……更多
Meta 公司发布 Imagine Yourself AI 模型
...家 8 月 23 日消息,从社交媒体到虚拟现实,个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整,从而限制了效率和可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
... 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景,这次大模型的升级进一步提升各个产品的AI能力及AI含量,实现更高的...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...好利用这个强大的开源模型,为领域模型或RAG系统的微调生成合成数据。Epoch AI上个月刚刚发文,结果。真实数据稀缺可能不再是问题了,Nemotron 9T token的预训练预料中,98%都是合成数据。也许你还对合成数据存在顾虑,或者不...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...拟创建的真实世界场景中评估学习到的控制器性能。这些基准环境的示例如下图 9 所示。此外,研究者进行了以下基线比较:需要特权地形数据(障碍)的专家策略; 使用相同 pipeline 训练的深度学生策略; 使用纹理上经典域随...……更多
AI重磅!“它太危险了,不能公开发布”
...越了之前的零样本TTS系统。它是同类产品中第一个在这些基准上达到与人类相当水平的系统。” 微软研究人员在一篇博客文章中写道:“VALL-E 2纯粹是一个研究项目。目前,我们还没有将VALL-E 2纳入产品或向公众开放的计划。在...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...步提升了编码、数学、推理和指令遵循能力。从下方多个基准测试结果可以看出,Yi-1.5 34B 型号的一些指标超过了 Qwen 的 72B,几乎与 Meta Llama 3 的 70B 相当。6B 和 9B 型号也成功超越了 Mistral 的 7B v0.2 版和 Gemma 的 7B 型号。……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...评估 SELF-GUIDE 的有效性,研究者从 Super-NaturalInstructions V2 基准中选择了 14 个分类任务和 8 个生成任务。研究者随机选择了一半任务用于超参数搜索,剩余的一半用于评估。在模型方面,研究者选择了 Vicuna-7b-1.5 作为输入生成、...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...型参数量和训练token数的最佳比率。如果你希望在论文的基准测试中得到最优模型,那么Chinchilla本身没有问题;但Meta要发布的旗舰模型还需要更高的推理效率。因此,我们选择增加训练的token数,并增加训练时长,让模型达到「...……更多
AIGC工具测评:生成式AI的产品表现如何
...Google 称 Gemini 是其历史上最强大、最通用的模型,在许多基准测试中都具有最先进的性能。Google DeepMind 的 CEO Demis Hassabis 称 Gemini 可以像人类一样理解我们周围的世界,并吸收任何类型的输入和输出,包括文本、代码、视频、音...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无...……更多
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
...加强大。" Google声称,根据自己的测试,2.0 Flash 在某些基准测试中的速度是该公司 Gemini 1.5 Pro 模型的两倍,而且在编程和图像分析等方面有了"显著"改进。 事实上,该公司表示,2.0 Flash 凭借其卓越的数学能力和"事实性",取代 ...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...3D、视频等更多模态,今年8月在SuperCLUE-V多模态理解评测基准总榜中排名第一。文生图方面,今年5月,腾讯混元全面开源业界首个中文原生DiT架构文生图大模型,评测结果国内领先。还有今天宣布开源的文/图生3D模型,单张图30...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...称Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果。 Gemini是谷歌各个团队大规模合作的成果,包括谷歌研究院的研究者,这个模型从发布之初就定位为原生多模...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...挑战。升级版Claude 3.5 Sonnet,编码王者干翻o1在各项行业基准测试中,升级版Claude 3.5 Sonnet性能得到了全方位提升。特别是,智能体编码、工具使用任务中取得显著突破。 论文地址:https://assets.anthropic.com/m/1cd9d098ac3……更多
GPT-4劲敌,谷歌进入高能+高产模式
....5 Pro官方测试数据Gemini 1.5 Pro大大超过Gemini 1.0 Pro,在27项基准(共31项)上表现更好,特别是在数学、科学和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini……更多
“3D视频版Sora”来了!
...成数据集。 二、混合采样保持时间一致,4D生成全面超基准线SV4D的技术论文也同步发表,其中详细解读了该模型的框架结构。总的来说,SV4D是一个用来生成动态3D对象新视图视频的统一扩散模型。给定一个单目参考视频,SV4D为...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
【新智元导读】Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛化的能力,这种独特的...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
..., Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论文标题:MMToM-QA:...……更多
AI一本正经地胡说八道 有种办法可以识破它
近年来,生成式人工智能在文本、图像、音乐等领域大放异彩。然而,随着生成式人工智能变得越来越强大,人们越来越难以鉴别AI生成的内容。近日,Google DeepMind 研究团队在《自然》(Nature)上发表的封面文章提供了一种文...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00