• 我的订阅
  • 头条热搜
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行(通常是让模仿互联网上的内容),目标是通过在较大的任务上训练模型,使得模型学习到通用的特征。而后训练指的是专注针对特定行为优化模型...……更多
“唤醒”甲骨文 厦大团队尝试用AI破译古老文字
...体字转换,史晓东收集了很多古文字资料,之后,他采用大规模古籍语料+人工智能办法,编写了一本异体字字典,收字接近9万字,应该是目前大陆最详尽的异体字字典。在此之前,台湾也有一本异体字字典,100多位语言学家花...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...生和博士后。将 PaperQA2 应用于矛盾检测任务让我们能够大规模识别生物学论文中的矛盾。例如,ZNF804A rs1344706 等位基因对精神分裂症患者的大脑结构有积极影响的说法与后来发表的研究相矛盾,该研究发现 rs1344706 对大脑皮质厚...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到,基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而,由于计算和内存成本随着序列长度的增加而增加,注意力机...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...均长度:语言多样性当今大量的商业化应用场景涉及处理多语言文档。Mistral Large 2 在大量多语言数据上进行了训练,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...文本模型开始,首先,添加图像适应器和编码器,然后在大规模有噪声的成对 (图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...,先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法。这些算法模型均在大数据支持下拥有较大规模模型参数,具备较强的通用能力,可完成多场景任务,显著降低学习成本...……更多
恒生电子:金融大模型技术升级,国内AI芯片危机互现
...标注和深度学习,这些是传统行业的特征。而AI大模型是大规模预训练的,也就是说是大数据一次性灌到参数里,再经过一些精调,它可以同时适用于多个应用领域和多项AI任务。这些应用领域不需要再做大规模数据标注,只需...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...功已经表明了数据结构在提升模型泛化能力中的重要性。大规模人脸识别数据集中天然地蕴含着丰富的数据结构信息,然而,在人脸识别任务中,目前还没有研究探索过如何挖掘并利用大规模数据集中所蕴含的结构信息来提升人...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...anding Paper Award)。研究者们已经并陆续构建了成千上万的大规模语言模型(LLM),这些模型的各项能力(如推理和生成)也越来越强。因此,在多样的应用场景中对其进行性能基准测试已成为了一项重大挑战。目前最受欢迎的基...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...级处理能力的任务。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。Gemini Pro专为多...……更多
国内首个官方“大模型标准符合性评测”公布
...榜单。据腾讯方面介绍,腾讯混元大模型符合《人工智能大规模与训练模型第2部分:测评指标与方法》语言大模型的相关技术要求。该模型号称拥有超千亿参数规模、预训练语料超2万亿tokens。同时,阿里云、腾讯云分别以技术...……更多
英伟达h100gpu在mlperf基准测试创造6项新记录
...6月报道,3584 个H100GPU群在短短11分钟内完成了基于GPT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。LambdaLabs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。英伟达最新的EosAI超级……更多
微软推出14b参数“最先进”小型语言模型
...以及训练后的创新,Phi-4在数学推理方面超越了同类和更大规模的模型。其在数学竞赛问题上的表现超过了包括GeminiPro1.5在内的多个更大规模模型。IT之家附有关基准测试结果的技术论文:点此前往微软宣布,将“强大且负责任...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...豆包之所以能在用户数量上暂时领先,离不开在抖音上的大规模投放,一位位抖音达人就是极具号召力的产品推介官。在AIGC跑马圈地的起步阶段,字节试图通过激进的投流策略将普通人拉上AI这条船。豆包的激进策略不仅体现在...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...的大模型工程体系vivoAI工程架构专家陈崇沛分享了vivo在大规模高性能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...腾讯联合北京大学、北京科技大学共同完成的研究《面向大规模数据的Angel机器学习平台关键技术及应用》,也斩获2023中国电子学会科学技术奖一等奖,体现了腾讯深厚的自研技术积累。在应用上,腾讯混元大模型已经支持了腾...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...微调)或RLHF(基于人类反馈的强化学习)不同,采用了大规模语料知识注入,让模型既保持了强大的通用语言理解能力,又大幅提升「剧本」这一特定应用领域的表现。在此之前,借助在AI和3D领域的客户积累,元象迅速将大模...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...到了一个有合适推理效率的平衡点。之所以做到405B这么大规模,其实原因很简单——我们想做出最好的模型,一个真正与GPT-4比肩的开源模型。(现在是GPT-4o了)虽然目前还没有完全达到目标,但差距正在逐渐缩小。正如小扎之...……更多
腾讯、同济大学重磅合作:打造大学教授AI智能体
...型生态;连接设计院校、专家、产业和消费者;助力实现大规模、个性化的教学科研与产业创新。合作的一个初步尝试,是大学教授AI智能体:Prof. Lou,它可以回答各种设计相关的专业问题。Prof. Lou收集了娄教授公开发表的著作...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...玩家,总是姗姗来迟,但却总是能够一鸣惊人,为产业的大规模应用创造机会。目前来看,随着未来不断有新的企业通过备案,“大模型+”的应用拐点正在到来。“大模型+”应用拐点加速到来8月份刚刚过去,9月初百度就迫不...……更多
...企业客户开放。据介绍,“双子座”Ultra版本是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。“大规模多任务语言理解”结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试人工智能掌握知识...……更多
依托大模型开启下一代智能营销 京东云言犀发布“AI营销搭子
...数字人领域成功落地后,言犀在营销领域的又一次重要的大规模实践。此外,他透露了自己的开店经历,他说到,从上品到推品,内容生产和货架转化是给每个商家的必答题,言犀就是要用技术承载京东20多年的电商经验,分享...……更多
最新美国国家人工智能科学院院士介绍
...来自牛津大学,专注于机器学习和数据挖掘,尤其在处理大规模数据集方面取得了显著成果。 SophiaWang,来自哈佛大学,致力于自然语言处理与机器翻译的研究,提高了多语言之间的转换准确率。EthanLee,来自加州大学圣地亚哥...……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...,一是加快推动高质量垂类语料数据开放共享。高质量、大规模的专业领域数据是提升垂直大模型的专业能力的重要基础。为形成更大合力,建议进一步引导来自不同领域的主体组建地方级、国家级大模型数据联盟,联合打造开...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00