• 我的订阅
  • 头条热搜
用过GPT-4 Turbo以后,我们再也回不去了
...,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大语言模型的自动数据分...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...后,开发者们甚至还发现,Reflection可能就是个「套壳」模型,而且还是连套三家的那种(Claude/GPT/Llama)。这下子,Reddit和X等平台上,立刻掀起了质疑的声浪。 左右滑动查看为此,Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...车。 另外的40%则是实打实的程序员,他们正在为OpenAI的模型「手搓」数据,从而让AI学习软件工程任务。此前,OpenAI一直是用从GitHub上抓取的代码训练其模型。而这次,OpenAI想建立的数据集中,不仅有代码,还包括背后用自然...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...,进化后的Claude 3.5 Sonnet一举击溃OpenAI o1,堪称最强推理模型。它在各个方面得到了全面显著的提升,尤其是业界领先的编码能力。而Claude 3.5 Haiku与上一代最强Claude 3 Opus性能相当,成本、速度与上一代Haiku相近。甚至,Claude现在...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...KER科技7月24日消息,今日凌晨,Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本,分别是8B、70B和405B。从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...生一周年之际,法国AI初创公司Mistral再次连发两个轻量级模型Ministral 3B和Ministral 8B,性能赶超Llama 3 8B。Mistral 7B仅仅发布一周年,法国AI初创小模型「les Ministraux」就打败它了。它堪称是,世界上最好的边缘模型。Ministra……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...日(9 月 24 日)发布博文,报道谷歌升级旗下 Gemini 1.5 AI 模型,推出了 Gemini-1.5-Pro-002和 Gemini-1.5-Flash-002,相比较此前版本成本更低、性能更强、响应更快。成本更低谷歌下调了 token 输入和输出费用,Gemini-1.5-Pro……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...两人均为 THUNLP 成员。钱成主要研究兴趣为工具学习,大模型驱动智能体,即将就读 UIUC 博士。何秉翔主要研究兴趣为大模型对齐与安全,即将就读清华大学博士。本文通讯作者为从鑫与林衍凯,指导教师为刘知远副教授。在人...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...改进的智能体系统铺平了道路。「法官」智能体,击败大模型现有评估方法,无法为智能体系统的中间任务解决阶段,提供足够的反馈。另一方面,通过人工进行更好的评估,代价太大。而智能体系统的思考方式,更像人类,通...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
微软发布旗下最小语言模型phi-2
...会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...、平台运营、企业提效和游戏智能体等方面,以及生成式AI模型Claude3在视觉能力、安全性、代码辅助等方面的优势。演讲重点介绍了亚马逊云科技如何通过Claude3等生成式AI模型,为游戏公司沐瞳科技提供高效的游戏运营解决方案,实...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
更多关于科技的资讯:
big胆!一位up主引发两个车企法务部严正声明
没想到临近春节,车圈还能这么热闹。先是雷军转发了小米法务部的抓人声明,后是极氪法务部转发了去年发的微博并再次声明。上次算辟谣
2025-01-28 13:41:00
DeepSeek,这条诞生在杭州的“鲸鱼” 这几天在全球科技圈、资本圈掀起滔天巨浪
金鳞耀岁 共启新程梁文锋在总理座谈会上发言 新闻联播截图昨天傍晚DeepSeek最新发布的乙巳新年春节AI贺词 一场名为DeepSeek(深度求索)的风暴
2025-01-28 07:53:00
“洋”年货走俏 中国“年货经济”走向全球
置办年货始终是过年的重要仪式。最受老百姓钟爱的年货都有啥?阿里巴巴联合第一财经商业数据中心发布的首份“中国年货大数据报告”显示
2025-01-28 08:24:00
开心消费过大年!家电以旧换新正当时
大众网记者 张婷婷 魏现芳 济南报道随着春节的临近,家家户户都在忙着准备年货。国家以旧换新政策的推出,更是为广大消费者提供了一个选购家电年货的好机会
2025-01-28 08:42:00
一觉醒来,英伟达跌掉了2个半茅台,源头竟是杭州这家公司
来自DeepSeek的震撼还在继续,美股科技股集体崩盘了,市场蒸发超一万亿美元。美国科技股大跌就在今天凌晨,美国标普500下跌1
2025-01-28 08:55:00
DeepSeek:线上服务受到大规模恶意攻击
1月28日消息,DeepSeek于服务状态页面公告:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录,
2025-01-28 08:55:00
向 “数” 向 “新”,南康构建现代化产业新体系
本文转自:人民网-江西频道自动化设备正在进行开料作业。张欣苑摄数智赋能,传统产业提质增效;新兴产业崛起,低空经济逐梦蓝天
2025-01-28 09:44:00
配备30台大功率充电终端!即墨汽车总站充电站上线运营
齐鲁晚报·齐鲁壹点 赵波 新春佳节的脚步日益临近,青岛城运能源科技集团为即墨市民送上了一份特别的节日礼物——即墨汽车总站充电站于1月27日正式上线运营
2025-01-28 13:49:00
2025年,中国给了世界第一个惊喜,还有些惊吓
毫无疑问,这是2025年,中国给世界的第一个惊喜。当然,对西方某些人来说,这也是惊吓。看了一下,北京时间1月28日凌晨
2025-01-28 09:50:00
【多彩新论】别让“电商专供”成为消费“陷阱”
在当下消费市场,“电商专供”产品似乎陷入了信任危机。卷纸变小、洗衣液变稀、同款产品线下难寻等现象频发,让“电商专供”在许多消费者心中与质量缩水画上了等号
2025-01-28 02:16:00
余承东华为3月重磅新品:别人想不到 全国人民抢购都买得起!
快科技1月28日消息,日前,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东开启直播,驾驶享界S9回安徽老家过年
2025-01-28 06:36:00
如不能正常浏览请选用IE浏览器天津北方网讯:潮购津门,乐呵过年。第二届天津电商节年货节,“一站式”购齐年货,欢欢喜喜过大年。#你好天津 #点赞天津……(津云新闻编辑张麒麟)
2025-01-27 15:37:00
AI入口 “爱”的入口
江南时报讯 春节是团圆的盛宴,凝聚着家的灵魂、力量与温暖。南来北往的游子,对于“家”有着更深的情结与眷恋。春运期间,中国电信联合江苏交通文化传媒有限公司在江苏高速阳澄湖
2025-01-27 15:51:00
完美世界再发反腐通报:开除4人,永不录用
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职
2025-01-27 16:03:00
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁)
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁),自动上锁不操心随着春节的脚步日益临近,人们纷纷踏上了归家的旅程
2025-01-27 16:11:00