• 我的订阅
  • 头条热搜
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果发现...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指令,且能回答关于苹果产品...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...eak Accept的水准。世界首个「AI科学家」诞生了!现在的大模型已经可以独立搞科研,甚至完全不需要人类插手。这不,它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
【新智元导读】哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多
...工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
港媒:中国科学家开发出AI模型或可预测全球洪水
...5月11日报道,中国科学家开发了一种新的人工智能(AI)模型,可以预测世界各地的洪水风险和跨区域流量,甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM,不同于其他预测模型依赖历史流量数据,它使用海拔和...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。近年...……更多
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
...就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...誉提名,其研究成果亦在快速走向产业化。作者使用生成模型的方法,开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode,二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHub Repo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
作者|黄楠编辑|袁斯来大模型今天所展示出的强大能力,源于背后海量数据,为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
苹果可能在早期开发中一直在使用谷歌硬件
...pleIntelligence的早期基础。这篇名为“苹果智能基金会语言模型”的研究论文非常具有专业性,并详细介绍了公司新技术核心语言模型的已知来源。然而,埋藏在论文中的一句话暗示,苹果可能在早期开发中一直在使用谷歌硬件。...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯片,即在iPhone上仅适用于iPhone15Pro...……更多
更多关于科技的资讯:
看大片更爽了 全国首家全高帧LED影院大年初一开幕:支持120帧放映
快科技1月26日消息,全国首家全高帧LED影院——华夏电影中心将于大年初一开幕,该影院位于北京市朝阳区北辰荟商业中心。据媒体报道
2025-01-26 07:35:00
《蛋仔派对》崩了 官方深夜致歉:各项异常均已修复
快科技1月26日消息,1月25日晚间,网易游戏《蛋仔派对》服务器疑似崩溃,玩家表示,好友被清空,啥都玩不了,啥都不能干
2025-01-26 07:35:00
纯血鸿蒙领衔!2024机圈热门技术总结
2024年,智能手机行业各条赛道多点开花,不仅硬件革新层出不穷,软件方面也因AI发展而不断提升。正值春节,今天我们就来盘点2024的五个重点技术
2025-01-26 07:35:00
极氪法务部:此前已辟谣“对撞”有关谣言 将追究造谣者法律责任
快科技1月26日消息,极氪法务部昨晚发布声明:“极氪已在2024年8月16日对有关谣言进行过辟谣,并表达了严正立场。今天注意到一些账号就此事情再度对极氪品牌进行无端的引导
2025-01-26 07:35:00
腾讯:《三角洲行动》2024年开挂封禁10年账号88万个
快科技1月26日消息,腾讯在2024年上线了重磅自研游戏《三角洲行动》,由天美J3工作室琳琅天上团队自主研发,是腾讯首款跨端战术射击游戏
2025-01-26 08:05:00
快科技1月26日消息,据媒体报道,近日,河南矿山集团举办了年会,会上公布该公司2024年产值高达103亿元,实现利润2
2025-01-26 08:35:00
女子买短乘长高铁霸座被行拘5天:网友齐声叫好
快科技1月26日消息,火车霸座不是新鲜事,总有人为了一己私利破坏规则和法律,那自然需要承担相应的后果。据央视网报道,近日
2025-01-26 08:35:00
能上网但不能洗澡:德国男子水下生活120天破纪录
快科技1月26日消息,近日,德国一名航空工程师因在巴拿马海岸附近的水下胶囊里生活了120天,打破了“水下生活时间最长”的吉尼斯世界纪录
2025-01-26 09:05:00
女子赛道内骑摩托逆行被撞:丝毫不认为自己有错
快科技1月26日消息,赛道里公然逆行,那可真是厕所里打灯笼——找死。1月25日,广东东莞麻涌赛车场发生一起女骑手逆行被撞的事故
2025-01-26 09:05:00
中小企观察 |“鲸算盘”携AI破局 为传统财务带来了怎样的变革?
大众网记者 高瑞嵩 青岛报道随着2024年人工智能(AI)迅速崛起,对其应用和前景的讨论就一直不绝于耳。特别是伴随一系列应用相继落地
2025-01-26 09:29:00
余承东开享界S9自驾回安徽老家过年:路上直播聊聊天
快科技1月26日消息,今天上午,余承东发文表示,今年过年开享界S9自驾回安徽老家,接两位朋友史小诺和说车的小宇在路上聊聊天
2025-01-26 09:35:00
向佐体验小鹏智驾频竖大拇指:很像赛车手开车 很厉害
快科技1月26日消息,近日向佐在广州喜提爱车小鹏X9,何小鹏带他体验了小鹏X9的最新车位到车位智驾能力,全程AI智驾护航稳如老司机
2025-01-26 09:35:00
611.767米!中联智慧产业城最长清水混凝土幕墙获吉尼斯认证
本文转自:人民网-湖南频道中联智慧产业成。受访单位供图“经专业测量公司测量,清水混凝土幕墙的连续长度达到611.767米
2025-01-26 10:24:00
一公司年会给员工送车 小伙领小米SU7激动到脚抽筋
快科技1月26日消息,据媒体报道,近日,深圳某科技公司在年会中慷慨地送出了多台新能源汽车,作为对员工辛勤付出的回馈,引起了广泛关注
2025-01-26 10:35:00
华为首款开放式耳机 曝FreeClip新配色玫瑰金2月开售
快科技1月26日消息,2024年12月,华为海外官网新增华为FreeClip“玫瑰金”配色,许多网友关心新配色何时发售
2025-01-26 10:35:00