• 我的订阅
  • 头条热搜
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的能力上限,Meta 官方称,在一系列任务中,其性能可与最好的闭源模型相媲美。下...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...,上线Apple Intelligence的首个版本,同时47页的苹果自研大模型技术报告重磅发布。Apple Intelligence首个版本上线了以下AI功能:1、Siri升级。Siri唤醒后具备屏幕边缘发光特效,能理解用户表述不通顺的指令,且能回答关于苹果产品...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...eak Accept的水准。世界首个「AI科学家」诞生了!现在的大模型已经可以独立搞科研,甚至完全不需要人类插手。这不,它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
字节版Sora火爆24小时,同名论文再次被热议
...憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型,支持文生/图生视频,时长可达10s。以PixelDance为例,其最大特色在于多主体交互,一致性多镜头生成。啥意思??——直接来看几个官方demo。First kill,现在手上有这...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
如果 AI 模型给的答案一点也看不懂,你敢用吗?随着机器学习系统在更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是...……更多
...工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
港媒:中国科学家开发出AI模型或可预测全球洪水
...5月11日报道,中国科学家开发了一种新的人工智能(AI)模型,可以预测世界各地的洪水风险和跨区域流量,甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM,不同于其他预测模型依赖历史流量数据,它使用海拔和...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。近年...……更多
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
...就一口气生成了十篇完整学术论文。△AI生成的一篇扩散模型论文从提出研究想法、检查创新性、设计实验、编写代码,到在GPU上执行实验并收集结果,最后完成论文撰写,一气呵成。全由这位“AI科学家”自动搞定。每篇论文...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...誉提名,其研究成果亦在快速走向产业化。作者使用生成模型的方法,开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode,二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
火爆全球的AI音频大模型,最新技术细节揭秘
...月19日在Arxiv上分享了Stable Audio Open的研究论文,公开了该模型背后的技术细节。Stable Audio Open是StabilityAI于今年6月推出的开源文本转音频模型,可免费生成长达47秒的样本和音效,还可生成44.1kHz高质量立体声音频,并且能在消费...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...得CoTracker在FastCapture数据集测试中表现出色,超越了众多模型,包括Meta自家的DINOv2。CoTracker的部署也相对简便,用户可以通过Colab版本或从GitHub Repo中获取相关代码和依赖来自行操作。这一开源工具的广泛应用前景令人激动,它...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...导师为教授 Nigel Collier 和 Ehsan Shareghi。他的研究兴趣是大模型和文本评估,数据生成等。共同一作为二年级博士生周涵,导师为教授 Anna Korhonen 和 Ivan Vulić,他的研究兴趣是高效大模型。大模型展现出了卓越的指令跟从和任务泛...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
作者|黄楠编辑|袁斯来大模型今天所展示出的强大能力,源于背后海量数据,为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
苹果可能在早期开发中一直在使用谷歌硬件
...pleIntelligence的早期基础。这篇名为“苹果智能基金会语言模型”的研究论文非常具有专业性,并详细介绍了公司新技术核心语言模型的已知来源。然而,埋藏在论文中的一句话暗示,苹果可能在早期开发中一直在使用谷歌硬件。...……更多
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...苹果的技术论文表明,TPU架构可以开发更大、更复杂的AI模型。三大新模块炸裂出圈随着iOS18.1Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能。据悉,本次更新只支持M系和A17Pro芯片,即在iPhone上仅适用于iPhone15Pro...……更多
在 OpenAI 公布的技术论文里,竟然藏着九大隐秘的线索!
...了抢先体验的后门,希望他们能够评估GPT-4的两项能力:模型自主复制能力模型获取资源能力虽然OpenAI在论文中强调了“ARC没法微调早期版本的GPT-4”、“他们无权访问GPT-4的最终版本”;也强调了测试结果显示GPT-4在上述两个能...……更多
...出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”。该研究显示,原始内容会在AI数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。生成式AI...……更多
RLHF不够用了,OpenAI设计出了新的奖励机制
OpenAI 的新奖励机制,让大模型更听话了。自大模型兴起以来,使用强化学习从人类反馈(RLHF)中微调语言模型一直是确保 AI 准确遵循指令的首选方法。为了确保 AI 系统安全运行并与人类价值观保持一致,我们需要定义期望行...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享的精神,对以上问题...……更多
更多关于科技的资讯:
FCB-EV9500M医疗术野摄像头实时数据传输靠谱吗?
在无人驾驶飞行设备、智能交通以及安防等高精度、高要求的领域中,实时数据传输的可靠性是保障系统稳定运行的关键。FCB-EV9500M作为一款高清一体化摄像机
2024-09-27 17:20:00
索尼4K模组FCB-CR8530在视频会议中的精彩表现
在当今数字化的时代,视频会议已成为人们日常沟通协作的重要方式。而索尼4K模组FCB-CR8530的出现,为视频会议带来了前所未有的精彩表现
2024-09-27 17:21:00
凯茉锐|索尼FCB模组FCB-EV9520L:30倍光学变焦
索尼FCB-EV9520L高清机芯模组,以其卓越的30倍光学变焦能力,在无人机、医疗成像及水下机器人等多个领域大放异彩
2024-09-27 17:23:00
HTX DAO重磅亮相Crypto Summit 2024
9月25日-26日,HTXDAO独家赞助CryptoSummit2024大会注册处,并以商业伙伴身份亮相。此举为HTXDAO展示其独特的去中心化治理模型提供了机会
2024-09-27 17:26:00
女子景区采了8朵蘑菇老公吃进ICU:自觉辨别菌子能力出色
快科技9月27日消息,据媒体报道,杭州的胡阿姨自觉辨别菌子能力出色,在家附近景区采了8朵蘑菇回家,用其中的6朵烧了一锅泡饭面条给丈夫老张吃
2024-09-27 17:31:00
江苏现1.5万亩巨型眼影盘:画面震撼
9月27日消息,据媒体报道,江苏连云港灌西盐场1.5万亩盐田呈现出缤纷色彩。经连日晾晒,盐池卤水浓度不断上升,颜色缓慢发生变化
2024-09-27 17:31:00
天玑9400最高分!OPPO Find X8 Pro卫星通信版跑分曝光:突破303万
快科技9月27日消息,今日知名数码博主数码闲聊站放出了OPPO Find X8 Pro卫星通信版的安兔兔跑分成绩,是迄今为止天玑9400芯片的最高分
2024-09-27 17:31:00
深圳通限时免费开卡:支持336个城市 适用华为苹果小米vivo和OPPO
快科技9月27日消息,深圳通微信公众号发布限时免费开卡活动。为欢度国庆佳节,手机深圳通互联互通卡限时开展0元免费开通活动
2024-09-27 17:31:00
曾毅首部电影官宣:《苍茫的天涯是我的爱》先导海报发布
9月27日消息,据媒体报道,公路喜剧电影《苍茫的天涯是我的爱》首波阵容官宣并发布两张先导海报。这部影片由刘震云担任艺术总监
2024-09-27 17:31:00
Linux曝出9.9/10分史诗级漏洞!影响几乎所有发行版、已存在10多年
快科技9月27日消息,近日,在Linux发行版中存在十多年的远程代码执行漏洞被披露,漏洞评分高达9.9分(满分10分)
2024-09-27 17:31:00
立省100块!特步篮球鞋官促:透气防滑券后89元
天猫【特步官方旗舰店】,特步篮球鞋日常售价为 189 元,今日可领取90元商品优惠券,到手99元。大概率还可以领到9.9元淘礼金(先到先得)
2024-09-27 17:31:00
四川数智化绿色化发展促进中心启动运行
本文转自:人民网-四川频道王凡嘉宾正在参观四川数智化绿色化发展促进中心1。四川数智化绿色化发展促进中心供图9月26日,由省市两级协同推进建设的四川数智化绿色化发展促进中心在成都正式投入运行
2024-09-27 17:34:00
火蝠电商荣获金瞳奖两项大奖,全域运营实力充分彰显
2024年9月20日下午,火蝠电商在金瞳奖颁奖典礼上获得了两项大奖。金瞳奖,外文名称ChinaContentMarketingAwards
2024-09-27 17:35:00
在时尚界,服装服饰作为表达个性、反映时代精神的重要载体,其流行趋势与行业发展始终是社会文化变迁的晴雨表。随着科技的飞速进步和互联网的普及
2024-09-27 17:36:00
鼎捷装备制造云闪耀智博会:垂直AI创新应用引领装备新未来
不久前,备受瞩目的第十四届智慧城市与智能经济博览会(简称“智博会”)在宁波圆满落下帷幕。以“数字赋能新型工业化”为主题的此次展会上
2024-09-27 17:45:00