• 我的订阅
  • 头条热搜
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下...……更多
多个中国团队斩获EMNLP\\\'24最佳论文!UCLA华人学者中三篇杰出论文
...,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果发现...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指令,且能回答关于苹果产品...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...eak Accept的水准。世界首个「AI科学家」诞生了!现在的大模型已经可以独立搞科研,甚至完全不需要人类插手。这不,它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
【新智元导读】哈佛大学研究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
最近一段时间,随着 OpenAI o1 模型的推出,关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出,只要给模型一些干扰,最聪明的模型也会犯最简单的错误(参见《给小学数学题加句「...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多
...工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
港媒:中国科学家开发出AI模型或可预测全球洪水
...5月11日报道,中国科学家开发了一种新的人工智能(AI)模型,可以预测世界各地的洪水风险和跨区域流量,甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM,不同于其他预测模型依赖历史流量数据,它使用海拔和...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。近年...……更多
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
...就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...誉提名,其研究成果亦在快速走向产业化。作者使用生成模型的方法,开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode,二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHub Repo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
作者|黄楠编辑|袁斯来大模型今天所展示出的强大能力,源于背后海量数据,为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
苹果可能在早期开发中一直在使用谷歌硬件
...pleIntelligence的早期基础。这篇名为“苹果智能基金会语言模型”的研究论文非常具有专业性,并详细介绍了公司新技术核心语言模型的已知来源。然而,埋藏在论文中的一句话暗示,苹果可能在早期开发中一直在使用谷歌硬件。...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯片,即在iPhone上仅适用于iPhone15Pro...……更多
更多关于科技的资讯:
小米澎湃OS 12月全球发版321个全量版本:平均每天11.88个
快科技1月14日消息,小米公司应用软件部总监@DaWang王乐 今天发文表示,小米澎湃OS的发版效率在不断提升,12月全球共发版OTA 321个全量版本
2025-01-14 20:54:00
近日,全球瞩目的2025年国际消费类电子产品展览会(简称“CES 2025”)在美国拉斯维加斯盛大启幕。山西数据流量谷入谷企业天娱数科创携自研Behavision空间智能MaaS平台首次登上CES 2025
2025-01-14 21:07:00
高铁站里的“科技范”
本文转自:人民网-江西频道南昌东站智能扫地机器人。舒文彬摄人民网南昌1月14日电 1月14日,随着G5002次列车驶离站台
2025-01-14 21:21:00
美国星巴克不再免费开放!中国区官方回应来了
快科技1月14日消息,近日星巴克宣布一项新规定,推翻了2018年来实施的开放政策,北美各地门店不再免费开放,进店需要消费
2025-01-14 21:24:00
余承东回应智界汽车方向盘太轻:大部分用户喜欢
快科技1月14日消息,近日,针对部分用户反映的智界R7方向盘手感过轻的问题,华为余承东今天进行了详细回应。余承东首先解释了智界R7方向盘默认采用舒适模式的原因
2025-01-14 21:24:00
全球首个!华为完成智能基站试点改造:网络增幅超过60%
快科技1月14日消息,最近,中国移动和华为联手推出了一款名为智能追焦单元(BTU)的新技术,并在广东省深圳市成功进行了全球首次试点
2025-01-14 21:24:00
今年春运“夜间高铁”又开了 平时为什么不开
2025年春运自1月14日起到2月22日结束为期40天,全国铁路预计发送旅客5.1亿人次,日均发送1275万人次,同比增长5
2025-01-14 21:24:00
高德地图启动2025年“温暖回家路”服务计划 多措并举提升春运出行服务效率
1月14日,2025年的春运拉开了大幕。据官方预计,2025年春运期间,跨区域人员流动量将达到90亿人次,自驾出行预计达到72亿人次
2025-01-14 21:47:00
威马电动车加装柴油取暖器开着开着冒烟了:非法改装 车辆被扣
快科技1月14日消息,据上海交警,近日,上海一辆威马电动车行驶到路口时,车辆突然冒出大量白烟。路口监控显示,看到车辆冒烟后
2025-01-14 21:54:00
一批中科大校友创业项目落地南京鼓楼 涉及人工智能等领域
本文转自:人民网-江苏频道活动现场。鼓轩摄1月12日,中国科学技术大学江苏校友发展大会在南京市鼓楼区召开,一批校友创业项目落地
2025-01-14 22:07:00
润泽园教育举办开年第一课,为小微企业揭示经营背后的小微大道
1月12日,润泽园教育举办了2025年第一次公开课,深度剖析了小微企业的生存现状和背后的大环境及经济发展趋势,并为小微企业提出了未来的生存建议
2025-01-14 22:06:00
磐石底盘120km/h碰撞A柱不变形怎么做到 宁德时代:三点原因
快科技1月14日消息,前不久,宁德时代发布了磐石底盘,这是一套以电为中心的CIIC一体化智能底盘,主打智能和安全,定位高效安全底座
2025-01-14 16:54:00
鲁网1月14日讯工商银行泰安分行聚焦电子支付发展成果、减费让利举措、优化企业开户服务以及惠企利民的实际成效,面向制造业
2025-01-14 16:54:00
法案获罕见一致支持!巴西将限制中小学生使用手机
1月14日消息,当地时间本月13日,巴西总统路易斯·伊纳西奥·卢拉·达席尔瓦签署了一项限制中小学生在校园内使用智能手机的法案
2025-01-14 16:54:00
2.5吨小身板拖动51吨大矿卡!极氪001创卡车最重牵引纪录
快科技1月14日消息,极氪官方今日宣布,极氪001创造卡车最重牵引纪录。据介绍,此次卡车最重牵引纪录挑战,是在-3℃的低温环境下
2025-01-14 16:54:00