• 我的订阅
  • 头条热搜
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
360发布高级威胁研究报告:有组织对我国新能源汽车领域长期攻击
...快科技2月11日消息,今日,360数字安全集团基于360安全大模型赋能,发布《2024年全球高级持续性威胁(APT)研究报告》(以下简称“报告”)。报告提到,2024年6月,北美大型汽车经销商软件服务提供商CDK全球连续遭遇两次网络...……更多
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
...动化整个 ML 工作流程,节省数千小时工时。Open AI 的推理模型 o1,这么快就被比下去了?本周五,AI 社区见证了又一项突破:一个完全自动化机器学习流程的 AI 工程师,能轻松获得 Kaggle 大师水平,在参与的 50 个 Kaggle 竞赛上获...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
...全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。我们都知道,在科研界,LLM在解决简单科学问题时表现得游刃有余,但在应对复...……更多
摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化
...ong Cheng, Jianzhong Qi 等学者团队联合完成。该团队专注于大模型、知识图谱、推荐搜索、自然语言处理、大数据等方向的研究。知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于...……更多
...现合成细菌在结肠癌、黑色素瘤、膀胱癌等多种疾病动物模型上具有优异的治疗效果,展现了治疗肿瘤的潜在靶向性和广谱性。那么,细菌究竟是如何抑制肿瘤的?又如何不被机体的免疫系统当作“敌人”消灭?细菌与肿瘤之间...……更多
全球科技界“AI月”来了 公募瞄准“科技+创新”
...升级”发布会,拉开了全球科技界“AI月”的序幕。最新模型“GPT-4o”多模态交互,可毫秒反馈,基本上已达到人类水平,再度搅动AI行业一池春水。叠加谷歌2024I/O开发者大会、微软Build年度开发者大会、苹果年度开发者大会(WW...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿” 在金融数字化转型加速的大背景下,AI人工智能机器人逐渐成为行业关注的焦点。近日,招联消费金融股份有限公司(以下简称“招联”)发布消费金融...……更多
限定120分钟科研挑战,o1和Claude表现超越人类
...长期科研还得靠人类在RE-Bench上,研究对比了基于大语言模型构建的Agent(目前主要公布了Claude 3.5 Sonnet、o1-preview)和50+人类专家的科研能力。值得注意的是,这些专家都有强大机器学习背景,其中很多人在顶级行业实验室或机...……更多
本文转自:劳动报大模型“价格战”重塑行业生态应用市场定价或受影响■劳动报记者 陈宁近期,一场由互联网巨头引领的大模型“价格战”在业内引发轩然大波。记者注意到,其连锁效应已逐渐渗透至应用市场,对用户使用...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...领域中,序列建模是一项至关重要的任务。然而,现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。因此,北京大学林宙辰、徐鑫提出了一种全新混合序列建模架构 ——MixCon,它为解决这些难题带来了创新...……更多
云从科技从容大模型荣登中国大模型第一梯队
...展,中国本土企业云从科技凭借其卓越的技术实力,在大模型领域取得了新的突破。 据权威测评机构SuperCLUE发布的最新《中文大模型基准测评报告》,云从科技自主研发的从容大模型不仅成功晋升至【领导者象限】,更以总分7...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
【新智元导读】Playground Research推出了新一代文本到图像模型PGv3,具备240亿参数量,采用深度融合的大型语言模型,实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自...……更多
...量、效益、规模、结构”协调稳健发展。未来已来,AI大模型开启智能新时代。招联以科技创新引领新质生产力,深耕数智技术,寻找智能时代消费金融的新模式、新解法。招联已相继推出业内首个130亿参数开源大模型“招联智...……更多
英伟达h100gpu在mlperf基准测试创造6项新记录
...PT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。LambdaLabs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。英伟达最新的EosAI超级计算机配备了 10752 个H100TensorCoreGPU和N……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...生一周年之际,法国AI初创公司Mistral再次连发两个轻量级模型Ministral 3B和Ministral 8B,性能赶超Llama 3 8B。Mistral 7B仅仅发布一周年,法国AI初创小模型「les Ministraux」就打败它了。它堪称是,世界上最好的边缘模型。Ministra……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
大语言模型(LLM)因“涌现能力”(emergent abilities)而拥有了超出人类预期的技能,但也因此让人类十分忌惮:操纵、欺骗人类,自主实施网络攻击,自动化生物研究......然而,也有专家认为,这种过度的担忧会损害开源和创...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
本文转自:中国工业报 2023年,以ChatGPT为代表的AI大模型风起云涌,引发了生产方式、生活方式、社会治理方式的深刻变革,成为新一轮科技革命和产业变革的重要驱动力量和战略性技术。我国也积极顺应新一代人工智能发展...……更多
研究人员提出artprompt新大模型注入手段
...sTechnica报道,研究人员近日提出了一种名为ArtPrompt的新大模型注入手段,其使用ASCII字符画替代关键文字进行提示输入,绕过了大模型的安全限制。举例来说,研究人员向大模型输入CounterfeitMoney(IT之家注:假币)中关键词汇Coun...……更多
给小学数学题加句废话,OpenAI o1就翻车了,苹果论文质疑AI推理
苹果新论文:AI 大模型可能不会推理。AI 大模型(LLM)真的像我们理解的那样能「思考」或「推理」吗?最近,苹果的一篇论文探讨了这个问题,并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
...根据差异进行识别?AI检测工具如何应对越来越聪明的大模型?带着这些问题,记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代,但到目前为止,AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多
OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
...周五凌晨,美国初创公司OpenAI举行直播活动,发布最新大模型GPT-4.5,作为预览研究逐步向用户开放。由于过去几周AI产业发生的惊天巨变,所以要准确形容这款被OpenAI藏了许久的大模型颇具挑战。OpenAI在新闻稿中表示,这是公司...……更多
“具身智能小镇”来了!机器人逛超市买菜满街跑,来自上海AI Lab
...,餐厅、超市、办公室、家庭等89个不同场景类别。由大模型驱动的NPC,可以在这个世界里和机器人对话交互。这样一来,各种机器人能在虚拟小镇里完成各种行为模拟,也就是最近流行的Sim2Real路线,能大幅降低具身智能现实...……更多
更多关于科技的资讯:
中新经纬11月19日电 中国疫苗行业协会微信公众号19日发布《关于反对“内卷式”竞争 促进疫苗及其相关生物制品行业高质量发展的倡议》(下称《倡议》)称
2025-11-19 17:36:00
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00