• 我的订阅
  • 头条热搜
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速...……更多
我用 Rust 改写了自己的C++项目:这两个语言都很折磨人!
...一筹呢?构建速度和运行时性能对我来说非常重要。构建测试的周期越短,我编程就越高效、越快乐。我会不遗余力地让我的软件速度更快,让我的客户也越快乐。因此,我决定亲自试试 Rust 的构建速度到底怎么样,计划如下:...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...能包含数十到数百个任务。如何解决呢?近年来,大语言模型在自然语言处理及各类任务的代码生成方面不断取得重大进展。同样,LLM 已经应用于机器人的多个方面,包括用户界面、任务和运动规划、机器人日志总结、成本和...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
文|王怡宁编辑|邓咏仪 尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GP...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
meta推出全新开源大模型codellama70b
近日,Meta正式宣布推出全新开源大模型CodeLlama70B,据悉,CodeLlama70B在HumanEval基准测试中的准确率达到了53%,超过了GPT-3.5的48.1%,并且接近OpenAI的一篇论文(PDF)报告的GPT-4的67%,是目前评分最高的开源大模型。据CNMO了解,Cod……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流...……更多
又热闹了!OpenAI的加强版“Her”正式开放,压过了Gemini的“生产级”大升级…
...gle,更确切地说,是Google今天刚刚更新的两款升级版Gemini模型:Gemini-1.5-Pro-002和Gemini-1.5-Flash-002。狙击方式简单粗暴:直接宣布万众期待的GPT语音功能今天起正式开放。两个小时不到,就双叒抢走了Google好不容易的高光时刻。我...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...iddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。除此之外,在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人员的反馈,这两个...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
【新智元导读】TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B,性能与Transformer架构模型相媲美,在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。今天,阿布扎比支持的技术创新研究所(TII) 开源了全球第一个通用的...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家Lauren...……更多
Google 创始人谢尔盖·布林回归,直面 Gemini、Google、AGI 若干问题
...谢尔盖·布林(Sergey Brin,以下简称布林)因为谷歌在大模型之战的大失利而亲赴前线,深入谷歌的大模型 Gemini的研发工作,继我们看到布林亲自给 Gemini 写代码、经常加班到凌晨的传闻之后,布林本人在 Gemini黑客松现身,对一...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...BZUAI 等学术机构学者组成的开源组织,致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。Maitrix.org 此前成功开发了 Pandora 视频-语言世界模型、LLM Reasoners,以及……更多
ai实验室阿里通义将推出创新视频生成大模型
...布,将在即将举行的云栖大会上推出一款创新视频生成大模型。目前,该模型的预约通道已在通义App及通义万相PC平台上开放,但具体使用权限尚未向公众开放。这款大模型由通义实验室精心打造,融合了“文生视频”与“图生...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...读】DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
OpenAI,正在open AI
...首席技术官米拉·穆拉提发布桌面版本的ChatGPT和新的旗舰模型—GPT-4o,OpenAI的发展,进入到了一个真正意义上的奇点时刻。OpenAI的短短26分钟的发布会,却依然引发了不少波澜。无论是ChatGPT-4o的完全免费,抑或是推出PC桌面版的C...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享的精神,对以上问题...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...的突破使得 GenAI 在多个领域广泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可...……更多
融资超25亿元,他们的目标和OpenAI很像
...会(CNCC2023)上,智谱AI推出了自主研发的第三代基座大模型ChatGLM3及相关系列产品。公开消息显示,目前智谱AI的估值已超100亿元,最高或达150亿元。作为一家2019年成立的公司,智谱AI是如何从国内诸多的大模型公司中成功突围...……更多
更多关于财经的资讯:
推进新型工业化走在前做示范,苏州路径何在?
□苏报记者 李刚政府工作报告提出,要“突出强基固本,大力推进新型工业化”。不久前召开的苏州“新年第一会”同样聚焦“新型工业化”
2025-01-15 17:18:00
交通银行:2024年半年度每股派发现金红利0.182元
财联社1月15日电,交通银行发布2024年半年度A股分红派息实施公告,本次利润分配每股派发现金红利0.182元(含税)
2025-01-15 17:18:00
沙洲电力2024年发电量创历史新高
苏报讯(驻张家港记者 陈梦娇 见习记者 张东慧)昨天,记者从永泰能源旗下张家港沙洲电力有限公司获悉,2024年,该企业共完成发电量193
2025-01-15 17:18:00
创梦天地(01119.HK)1月15日耗资116.39万港元回购69.48万股
格隆汇1月15日丨创梦天地(01119.HK)发布公告,2025年1月15日耗资116.39万港元回购69.48万股,回购价格每股1.62-1.72港元。/阅读下一篇/返回网易首
2025-01-15 17:19:00
冰川网络:预计2024年净利润亏损2.4亿元-3.4亿元,同比盈转亏
1月15日,深圳冰川网络股份有限公司(冰川网络,300533.SZ)发布业绩预告,预计2024年归属于上市公司股东的净利润亏损2
2025-01-15 17:20:00
上海全面推行建筑“光伏+”应用,51只概念股闻风上涨
1月15日,A股光伏设备板块异动,福莱特、赛伍技术、海泰新能、艾能聚、双良节能、钧达股份、聚合材料、金刚光伏等个股纷纷上涨
2025-01-15 17:28:00
王义善
王义善,深圳市潍坊商会会长、深圳赛菲尔珠宝首饰公司董事长。责任编辑:赵岳
2025-01-15 17:36:00
陕国投盘中涨停!去年净利13亿,第四季度计提金融资产减值准备1.09亿
陕国投2024年业绩增速同比放缓。 文|记者 何秀兰1月15日,陕西省国际信托股份有限公司(000563.SZ,下称“陕国投”)股价盘中一度涨停
2025-01-15 17:41:00
抓住时机!这类股票迎来低吸时刻
反弹没有再接再厉,今天各大指数全线回调,尤其是创业板跌幅达2%左右,超过3600只个股下跌,盘面上除了小红书概念和机器人概念股表现活跃
2025-01-15 17:44:00
峰岹科技(688279.SH):递交H股上市申请
峰岹科技(深圳)股份有限公司(证券代码:688279,以下简称“峰岹科技”)于2025年1月15日宣布,公司已向香港联合交易所有限公司(以下简称“香港联交所”)正式递交了发行H股股票并在其主板挂牌上市的申请
2025-01-15 17:46:00
航天电器跌停 机构净卖出2.16亿元
中国经济网北京1月15日讯今日,航天电器(002025.SZ)跌停,收报44.23元,跌幅9.99%,总市值202.07亿元
2025-01-15 17:48:00
惠通科技龙虎榜:1家机构进卖出前5 净卖共640.63万元
中国经济网北京1月15日讯 惠通科技(301601.SZ)今日在深交所创业板上市,收报47.40元,涨幅301.69%
2025-01-15 17:48:00
5连板苏豪弘业:主营业务未发生改变 不涉及AI技术相关业务
苏豪弘业发布股票交易异常波动公告,目前公司主营业务未发生改变,不涉及AI技术相关业务。公司控股子公司江苏弘业永恒进出口有限公司推出的智能毛绒玩具中置入具有AI功能的模块
2025-01-15 17:50:00
9万股民懵了,亿晶光电开年“爆雷”,预计2024年最高亏损3
日前,亿晶光电(600537.SH)发布2024年业绩预亏公告,公司预计2024年净亏损19亿元至32亿元,与上年同期盈利0
2025-01-15 17:50:00
燕京啤酒:预计2024年净利润10亿元-11亿元,同比增55.11%-70.62%
1月15日,北京燕京啤酒股份有限公司(燕京啤酒,000729.SZ)发布业绩预告,2024年预计归属于上市公司股东的净利润为10亿元至11亿元
2025-01-15 17:50:00