• 我的订阅
  • 头条热搜
用过GPT-4 Turbo以后,我们再也回不去了
...,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...术背景人员不可或缺的工具。以 GPT-4 为代表的大型语言模型,它们已经能够理解自然语言查询,并能生成相应的代码或分析,让自动数据分析变得更加接近现实。例如,Devin 的成功,激发了人们对基于大语言模型的自动数据分...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...车。 另外的40%则是实打实的程序员,他们正在为OpenAI的模型「手搓」数据,从而让AI学习软件工程任务。此前,OpenAI一直是用从GitHub上抓取的代码训练其模型。而这次,OpenAI想建立的数据集中,不仅有代码,还包括背后用自然...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的思路,即编写多个不同的提示词并对其进行测试,只不过是让整个过程自动化。后面我们会看到,这个过程非常类似于传统...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...KER科技7月24日消息,今日凌晨,Meta官方正式发布了Llama3.1模型。本次Llama3.1模型共有三个版本,分别是8B、70B和405B。从基准测试结果来看,超大杯Llama3.1405B与OpenAI的GPT-4o和Claude3.5Sonnet在多个项目上能够媲美。在GSM8K任……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...为“我要失业了!”3月15日凌晨,OpenAI正式发布多模态大模型GPT-4,它可以接受图像和文本输入。虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平,比如在法律考试中可以打败90%的人类。...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...两人均为 THUNLP 成员。钱成主要研究兴趣为工具学习,大模型驱动智能体,即将就读 UIUC 博士。何秉翔主要研究兴趣为大模型对齐与安全,即将就读清华大学博士。本文通讯作者为从鑫与林衍凯,指导教师为刘知远副教授。在人...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com随着大模型研究的深入,如何将其推广到更多的模态上已经成为了学术界和产业界的热点。最近发布的闭源大模型如 GPT-4o、Claude 3.5 等都已经具备了超强的图像理解能力,LLaVA-……更多
微软发布旗下最小语言模型phi-2
...会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...、平台运营、企业提效和游戏智能体等方面,以及生成式AI模型Claude3在视觉能力、安全性、代码辅助等方面的优势。演讲重点介绍了亚马逊云科技如何通过Claude3等生成式AI模型,为游戏公司沐瞳科技提供高效的游戏运营解决方案,实...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...PT时刻」》AI视频背后有两条技术路线,一条基于Transformer模型,另一条基于扩散模型(Diffusion model)。尽管AI视频技术取得进展,但还未达到真正的GPT时刻,即AI视频融入视频生产工作流并满足广泛需求的阶段。目前AI视频领域的...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...者,该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题:Planning In Natural Language Improves LLM Search For Code Generation 论文地址:https://arxiv……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
...消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品迷。2016...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...满。不知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,不管你愿意不愿意看,推荐算法都会确保ta出现在你的时间线上。昨天,草莓哥声...……更多
Github Copilot 初体验
...rative Pre-trained Transformer 3)是一个用于处理自然语言的 AI 模型,由 OpenAI 训练开发。GPT-3 通过阅读几乎一切人类可阅读的内容来进行训练,理论上,它能够完成一切通过语言完成的工作,而且完成效果还非常接近人类。已经有实...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
LLM取代的第一个编程语言竟是SQL?网友吵翻天
...开源的桌面端程序,Prompt 的调试与管理工具,支持 OpenAI 模型、Claude、Google Gemini 等。从大模型出现以来,改变的不仅是文字、图片生成领域,还有编程领域。这些 AI 助手给句提示就能自主学习新技术、构建和部署应用程序、以...……更多
更多关于科技的资讯:
华强北iPhone16系列报价表一览:苹果今年惨 只有Max溢价
苹果iPhone16系列新机已于9月20日正式开售。对于想购买或者想出手转让iPhone16系列新机的朋友,不妨先浏览下深圳华强北的报价
2024-09-21 21:25:00
北京首个万兆宽带 遭遇百度网盘非VIP 秒变2G网络
快科技9月21日消息,日前,北京联通联合华为,正式发布万兆宽带,999元/月。朝阳区一位B站UP主成为首位用户,经过实测
2024-09-21 21:25:00
余承东谈飞机上被拍到使用华为Mate XT非凡大师:泄密要被罚款
快科技9月21日消息,9月20日,全球首款三折叠机型华为Mate XT非凡大师正式开卖,起售价是19999元。早在发布之前
2024-09-21 21:55:00
迈向AI时代的新出版如何实现创新发展?这场数字出版创新发展论坛深度探讨
南海网记者 汪慧随着人工智能(AI)的快速发展,科技与出版传媒深度融合已经走向纵深。出版业如何应对人工智能带来的变革,成为出版传媒业高质量发展的新命题
2024-09-21 22:07:00
台风普拉桑复活了:再度加强为热带风暴级
9月21日消息,据中国天气消息,今年第14号台风“普拉桑”减弱后的热带低压昨天晚上移入黄海南部海面后强度有所加强,今天凌晨再度加强为热带风暴级
2024-09-21 22:25:00
2024年太原马拉松赛9月22日燃情开跑,为确保这场家门口的国际体育盛事网络通信安全畅通,山西移动太原分公司以一系列先进技术手段
2024-09-21 22:43:00
华硕Prime RTX 4070 Ti SUPER显卡亮相
今年6月,华硕推出了PrimeGeForceRTX40系列显卡,首批共有三款GPU,分别是RTX4060Ti、RTX4070和RTX4070SUPER
2024-09-21 22:43:00
赛睿推出Arctis Nova 5白色系列耳机
赛睿(SteelSeries)宣布,推出ArctisNova5白色系列无线耳机,为用户带来了时尚的新配色。除了正常版本外
2024-09-21 22:44:00
传AI芯片设计公司Ampere寻求出售,或选择放弃IPO
据DigiTimes报道,有知情人士透露,由甲骨文公司(Oracle)创始人LarryEllison所支持的AI芯片设计公司Ampere正在探索出售的潜在可能性
2024-09-21 22:44:00
疑似英特尔Core Ultra 9 285K包装曝光
代号为ArrowLake-S的酷睿Ultra200系列桌面处理器已经确认会在10月10日发布,不过上市时间从原本的10月17日推迟到10月24日
2024-09-21 22:44:00
海韵推出CORE GX ATX3系列电源
9月20日,海韵正式推出了COREGXATX3系列电源。根据官方介绍,海韵COREGXATX3系列电源中文名为“游戏酷核”
2024-09-21 22:45:00
更多英特尔Arrow Lake-S零售包装曝光
英特尔已敲定了代号“ArrowLake-S”的酷睿Ultra200系列台式机处理器在2024年10月10日发布,不过上市时间从10月17日延后至10月24日
2024-09-21 22:45:00
七彩虹iGame Ultra系列全家桶装机体验
说到电脑硬件“全家桶”,可能大部分玩家第一时间会想到“ROG”,他作为目前电脑市场上生态产品运营的巨头,希望自家的品牌能够覆盖到电脑的每一个配件上面
2024-09-21 22:45:00
高通已向英特尔提出收购建议,交易完成后或将其部分资产出售
本月初就有报道称,过去几个月里,高通一直在研究收购英特尔部分设计业务的可能性,以增强旗下的产品组合。高通对英特尔所有的设计部门进行了评估
2024-09-21 22:45:00
雷神推出CF25F300L显示器
9月20日晚,雷神(ThundeRobot)正式推出了CF25F300L显示器,目前该显示器已上架京东商城并开启预约活动
2024-09-21 22:46:00