• 我的订阅
  • 头条热搜
被字节起诉索赔 800 万的实习生拿下 NeurIPS 2024 最佳论文
...顶级学术会议NIPS2024最佳论文近日出炉,字节跳动"破坏大模型训练"的前实习生田某某与字节合作论文被人工智能顶级会议NeurIPS评为最佳论文(BestPaper),引发关注。今年10月,字节跳动发布《关于"实习生破坏大模型训练"的事实...……更多
专家模型不要专家并行!微软开源MoE新路径
...日,来自微软的研究人员开源了使用全新方法训练的MoE大模型,不走寻常路,且编码和数学表现出色。继Phi家族之后,微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头(16 * 3.8B),却采用了截然不同的训练方法...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
OpenAI 最近公布了其令人惊叹的视频生成模型 Sora,打破了文本到视频生成模型的天花板。近日,谷歌 DeepMind 也展示了最新的文本到视频游戏的生成模型。(来源:GOOGLE DEEPMIND)这款名为 Genie 的新模型可以接受简短的文字描述、...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
首个“开源chatgpt”来了:基于谷歌5400亿参数大模型
...快吧,首个开源ChatGPT项目已经出现了!基于谷歌语言大模型PaLM架构,以及使用从人类反馈中强化学习的方法(RLHF),华人小哥 PhillipWang 复刻了一个ChatGPT出来。项目GitHub星已经超过1.7k了,而且还在一路飙升ing。不过一反常态的...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多
谷歌deepmind公布ai模型训练法
...15日消息,谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind(下同)据悉,FunSearch模型训练...……更多
聊天机器人目前还不理解的一件事:“否定”
...那么聪明。2018 年 10 月,谷歌发布了一种名为 BERT 的语言模型算法,同一领域的研究人员卡斯纳迅速将其加载到了自己的笔记本电脑上。这是谷歌的第一个基于大量在线数据的语言模型。像大多数同行一样,卡斯纳对 BERT 补全句...……更多
寒武纪神经网络模型量化训练方法专利获授权
...全资子公司安徽寒武纪信息科技有限公司“一种神经网络模型的量化训练方法、装置及设备”专利获授权。企查查专利摘要显示,该方法包括:在正向传播过程中,获取待量化层的第一输入数据和参数;分别对第一输入数据和参...……更多
科大讯飞申请对话模型训练等专利,提升多轮对话的生成质量
...局信息显示,科大讯飞股份有限公司申请一项名为“对话模型训练方法、对话方法、系统、设备及介质”的专利,公开号 CN119862964A ,申请日期为 2025 年 3 月。专利摘要显示,本发明提供一种对话模型训练方法、对话方法、系统...……更多
...外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...许是为了缓解广大网友的热切期待,OpenAI在今天放出了新模型CriticGPT,相当于GPT-4的「拐杖」。我们训练了一个模型CriticGPT,来捕获GPT-4生成代码中的错误。我们开始将此类模型集成到RLHF对齐管道中,以帮助人类监督AI执行困难...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...数据增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却...……更多
中国石油发布700亿参数昆仑大模型建设成果
...月28日,以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多
腾讯申请文本标签预测方法等专利,提高了综合标签打分模型的预测准确率
...景,所述方法包括:将目标多媒体资源输入综合标签打分模型,得到目标文本标签以及目标文本标签的目标分数;综合标签打分模型为基于第一样本分数结果与第一样本分数标签之间的差异,对待训练标签打分模型进行训练得到...……更多
OpenAI GPT-4 AI 模型无需额外训练可通过日本理疗师考试
...消息,一项新的同行评审研究表明,OpenAI 的 GPT-4 大语言模型无需任何额外训练,即可通过日本国家理疗考试。最新发表在《Cureus》杂志上的新研究,测试了 GPT-4 的文字和视觉技能。IT之家注:日本国家物理理疗师考试包括 160 ...……更多
华为、特斯拉带头 车企卷入“大模型”军备竞赛
作者 | 周永亮编辑 | 靖宇自动驾驶的进程,因为大模型又起波澜。近几年,自动驾驶近年发展迅猛,硬件预埋软件持续迭代的风潮下,车载算力急剧增长快速普及,但软件端功能进化滞后于算力。人们似乎开始接受要经过很长...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
...人 、新加坡国立大学校长青年教授尤洋发表了题为《大模型训练的关键技术》的主题演讲。尤洋指出,庞大的AI模型规模对模型训练提出了挑战,现有的硬件设备已无法满足训练所需的大量计算资源和储存空间需求。为解决上述...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
视频大模型进入百模大战。今年是“视频生成”大模型爆发元年。在过去两个月,我们看到了快手可灵、商汤Vimi、Luma AI、爱诗科技Pixverse、Runway Gen-3等等视频大模型的你追我赶。但上半年的视频生成大模型公司,往往只聚焦在...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
...科学家们已经建立了一个框架,通过将它们浓缩到更小的模型中,在不影响质量的情况下,给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明,由于一项技术可以将整个100个阶段的过程浓...……更多
自然语言处理:大模型理论与实践
今天分享的是:自然语言处理:大模型理论与实践报告共计:450页《自然语言处理:大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。虽然是小版本更新...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...模态不可学习样本,以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器,MEM方法有效地误导模型,降低其对隐私数据的学习能力,并在不同模型间展现出强大的可迁移性。多模态对比学习(如CLIP)...……更多
真香!智谱大模型,有了首个免费的API
大模型API,正式进入Flash时代。最近一段时间,国内外的大模型行业卷的是「快速版」。5 月谷歌 I/O 大会上,新发布的 Gemini 1.5 大模型序列中出现了 Flash 版,主打轻量化和响应速度。到 7 月,OpenAI 又在 GPT-4o 的基础上推出了 Min...……更多
广州视源电子科技股份有限公司申请图像分辨率放大模型训练专利,提高图像分辨率放大的计算效率
...源电子科技股份有限公司申请一项名为“图像分辨率放大模型训练方法、装置、存储介质及设备”的专利,公开号CN 119693730 A,申请日期为2023年9月。专利摘要显示,本申请公开了一种图像分辨率放大模型训练方法、装置、存储...……更多
京东方A获得发明专利授权:“摘要生成模型训练方法、装置、电子设备和非瞬态计算机可读存储介质”
...(000725)新获得一项发明专利授权,专利名为“摘要生成模型训练方法、装置、电子设备和非瞬态计算机可读存储介质”,专利申请号为CN202110349303.4,授权日为2025年3月11日。专利摘要:本发明提供一种摘要生成模型训练方法、...……更多
更多关于社会的资讯:
《穹天玉宇》圆满落幕:沉浸式中国藻井数字艺术展精彩回顾
“穹天玉宇——沉浸式中国藻井数字艺术展”(简称“穹天玉宇”)以中国古建筑藻井艺术为核心,融合前沿数字技术打造出一场独具特色的新媒体艺术体验
2025-09-25 13:38:00
“忆江南”浙江省非物质文化遗产展走进马耳他
2025年9月19日,由浙江省文化广电和旅游厅与马耳他中国文化中心共同主办,浙江省非物质文化遗产保护中心承办的“忆江南”浙江省非物质文化遗产展在马耳他中国文化中心开幕
2025-09-25 13:38:00
张清清“查无此人” 原是张湛清跑出了暖心“加速度”
大皖新闻讯 “张清清?咱们南站哪有人叫张清清哦!”9月24日,望着旅客王先生刚寄来的一封表扬张清清的感谢信,蚌埠南站雷锋服务台里的三人面面相觑
2025-09-25 13:13:00
蚌埠国庆节当天正常办理结婚登记 详细地点公布
大皖新闻讯 9月25日,记者从蚌埠市民政局获悉,为满足新人们国庆节婚姻登记需求,进一步提升婚姻登记便民服务水平,该市部分婚姻登记处将于10月1日上午正常办理结婚登记业务
2025-09-25 13:11:00
沈阳热电石油经销有限公司因违反安全生产管理规定被罚1万元
近日,沈阳市铁西区应急管理局公布一则行政处罚决定,沈阳热电石油经销有限公司因在加油机附近堆放可燃物品,违反安全生产管理规定
2025-09-25 10:46:00
29月23日下午,2025年多邻国教育峰会落幕。这是多邻国英语测试举办的第三届中国峰会。本次峰会以“教育无界,梦想共生”为主题
2025-09-25 09:22:00
山东省贸促会:驭经贸之舟,扬帆山东对外贸易新航程
齐鲁晚报·齐鲁壹点记者 于民星今年以来,面对复杂多变的国际经济形势,山东省贸促会围绕稳企业、稳市场等重点任务,通过一系列创新举措
2025-09-25 10:46:00
太重集团9月22日发布消息,在国家工业和信息化部刚刚公布的2025年度卓越级智能工厂项目名单中,太原重工轨道交通设备有限公司高速轮轴全流程制造智能工厂名列其中
2025-09-25 06:32:00
文明健康 有你有我清晨7时,赶着去龙潭公园晨练的老人陆续登上803路公交车。此时正值早高峰,车厢里人多拥挤,乘客摩肩接踵
2025-09-25 07:34:00
打破地域壁垒,江苏医保生育服务再加码省内异地分娩费用实现“即生即报”南报网讯(记者王婕妤)江苏医保生育服务再“加码”。近期
2025-09-25 07:39:00
南报网讯(通讯员鼓轩记者王婷婷)9月23日,第十二届产业数字化大会在鼓楼举行。活动中发布最新产业数字化赋能平台,同时启动“中德中小企业‘人工智能+’合作伙伴计划”
2025-09-25 07:40:00
记者走基层|一家县级小医院 引来百位大专家
9月16日,中国人民解放军火箭军特色医学中心肝胆外科医生刘军桂(右)在黄骅市人民医院为患者诊断病情。河北日报记者 李 傲摄9月16日清晨6时
2025-09-25 07:59:00
车主抱着对4S店和汽车品牌的信任购买了保养服务套餐,如今却因门店突然关停,面临“钱交了、服务没了”的境遇。汽车品牌方以“经销商独立经营”为由推诿
2025-09-25 08:00:00
近日,上海市嘉定区南翔镇社区卫生服务中心创新“家医夜市”模式,派出63支家庭医生团队,为户外劳动者提供夜间服务。在一家顺丰网点
2025-09-25 08:01:00
沪一美术馆引入“讲解神器”,可与人互动、拍照答疑
中国青年报客户端上海9月24日电(中青报·中青网记者 王烨捷)你是否遇到过在博物馆租借的智能导览反应不灵敏的情况?当你走近文物
2025-09-25 06:04:00