• 我的订阅
  • 头条热搜
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿” 在金融数字化转型加速的大背景下,AI人工智能机器人逐渐成为行业关注的焦点。近日,招联消费金融股份有限公司(以下简称“招联”)发布消费金融...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...手的AI论文在外网引发热议。论文中,研究团队提出了Q*模型算法,帮助Llama-2-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...谷歌公司宣布推出其规模最大、功能最强大的新大型语言模型Gemini,其最强大的TPU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
单卡搞定Llama 3.1(405B),最新大模型压缩工具来了!最近Llama-3.1登上开源顶峰,但其最强的405B版本模型900多GB的内存需求,对资源构成了更加苛刻的挑战。北航、商汤、南洋理工等团队联合推出的大模型压缩工具与基准LLMC,能...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...往无法判断精妙的属性并提供令人满意的结果。大型语言模型 (LLM) 的最新进展启发了 “LLM-as-a-judge” 范式,其中 LLM 被用于在各种任务和应用程序中执行评分、排名或选择。本文对基于 LLM 的判断和评估进行了全面的调查,为推...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显...……更多
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品
...用计算机开始,伴随着Windows 95、加速计算乃至深度学习模型AlexNet的出现,再到2016年,黄仁勋亲手将第一台DGX-1超级计算机送给了OpenAI。而在2022年,随着聊天机器人ChatGPT横空出世,生成式AI带来了全新一轮产业革命。黄仁勋手绘...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...作开发了 ExploreToM 框架,旨在更有效地评估和训练大语言模型(LLM)的心智理论(Theory of Mind,ToM)能力。心智理论心智理论(Theory of Mind,ToM)是人类社会智能的基础之一,能让我们能够理解他人的想法、意图和信念。这种认...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推理任务而...……更多
自主研制!我国发布全球首个百亿级遥感解译基础模型
...天信息技术大会上,我国自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版正式发布。据了解,这是迄今全球首个百亿参数级空天一体遥感解译基础模型。3.0版内核工作架构基于热传导,这是联合团队自主研发的一套...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
文|王怡宁编辑|邓咏仪 尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GP...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答
只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱!这就是由华盛顿大学和艾伦人工智能研究所(Ai2)打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
让AI无处不在 高通全面开启终端侧生成式AI大门
...,AI将重塑消费者对用户体验的感知,骁龙将成为所有AI模型在终端侧运行的首选平台。基于这样的价值考量,在今年骁龙峰会上,高通推出了两款全新平台,二者无不强调了终端侧生成式AI体验的需求,从底层为用户提供贴近生...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多次失手,OpenAI 异军突起,硅...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...过。但是,也需要说明这些测试存在局限:仅使用了一种模型,即来自 Meta 的 Llama 2 70B。希望未来能看到这些测试中使用更多不同的 AI 模型。对 MI300X 及 AMD 未来的 GPU 来说,这个结果很是不错。但到今年年底时,考虑到英伟达 B...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...息,通义千问(Qwen)今天宣布经过数月的努力,Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级,并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下:5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
【新智元导读】代码模型可以自己进化,利用自身生成的数据来进行指令调优,效果超越GPT-4o直接蒸馏!LLM作为智能的基座,可以衍生出各种能力。代码能力就是其中一种:程序补全、注释、优化、修bug、测试等等。而想要充...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流...……更多
更多关于科技的资讯:
联想摩托罗拉首次进入日本手机市场前三!超越本土索尼、夏普
快科技2月6日消息,据Techinsights最新数据,2024年第四季度,联想摩托罗拉首次跻身日本智能手机市场第三,市场份额创纪录地达到8
2025-02-06 07:43:00
安徽农户家惊现50厘米巨型马蜂窝 大如“水桶”
快科技2月6日消息,据阜阳消防消息,安徽阜阳市太和县李兴镇一村民,在自家老房子里意外发现了一个形如“水桶”般的马蜂窝,随即拨打了报警电话
2025-02-06 07:43:00
紫金山实验室新年誓将“南京成果”写进国际标准□南京日报/紫金山新闻记者张安琪今年6月,6G国际技术标准研究将正式启动。目前进展如何
2025-02-06 07:47:00
春节宽带不灵了“介个办介个办” 最多一天接9个工单,个个及时上门服务
大年初五,朱云和他的搭档正在为用户修复夹断的光纤线。记者 徐林军 摄2月2日早上8点半不到,中国电信笕新营业厅的大灯已经亮起
2025-02-06 07:56:00
主题促消费活动+“政策大礼包”今年春节,杭州消费市场“热气腾腾”,“两新”政策加力扩围下,多地通过举办丰富多彩的促消费活动
2025-02-06 07:56:00
没了它通信行业就完了吗 其实这个频段真没这么重要
啊?我们通信行业又要出大事儿了?事情是这样的,前段时间我们在整理 2024 年四季度发布的这批旗舰。大伙关心比较多的处理器
2025-02-06 08:13:00
DeepSeek日活突破2000万:达ChatGPT的40%
快科技2月6日消息,据报道,国内AI产品榜的最新统计数据显示,DeepSeek应用在上线仅20天后,便取得了令人瞩目的成绩
2025-02-06 08:13:00
孩子高速上下车被应急车道车撞飞引争议:官方回应无法核实该事故
快科技2月6日消息,近日有孩子在高速上下车被应急车道车撞飞,视频发出后引来了网友的围观,对此官方进行回应。网传视频显示
2025-02-06 08:13:00
奔驰SUV卡点免费下高速失败:超了1分钟不愿意给钱
快科技2月6日消息,今年春节假期的高速免费时间为1月28日(腊月二十七)0:00-2月4日(初八)24:00,每年在免费时段即将结束时
2025-02-06 08:13:00
iPhone 16 Pro Max首次跌出iOS性能榜前十:A系列芯片完败
快科技2月6日消息,安兔兔最新发布了2025年1月份的iOS设备性能排行榜,最为苹果最新一代超大杯,iPhone 16 Pro Max直接跌出前十
2025-02-06 08:13:00
骁龙8至尊版价格屠夫登场!真我GT7 Pro竞速版下周见
快科技2月6日消息,今日,真我realme副总裁、全球营销总裁、中国区总裁 徐起发文称:真我GT7 Pro竞速版下周见
2025-02-06 10:43:00
节省时间空间!微软Win11应用商店迎更新:可模块化下载游戏
快科技2月6日消息,微软正在为Windows 11应用商店测试一项新功能,允许用户模块化下载游戏。这项功能目前在Canary通道的Windows Insider Build 27888版本中进行测试
2025-02-06 10:43:00
鸿蒙原生版百度地图大升级:导航语音包终于上线
快科技2月6日消息,鸿蒙原生版百度地图近日迎来大升级,最新版本号为1.3。据了解,此前版本的百度地图就支持查地点路线、车道级导航
2025-02-06 10:43:00
真机实测:搭载兆芯KX-7000的同方全国产台式机评测体验
一、前言随着信创产业的持续发展和深入,国产PC在各大领域已经得到了不同程度的推广和使用。大家熟知的PC品牌,早早就深入布局国产化领域
2025-02-06 10:43:00
阿里加速AI To C赛道布局:世界顶级人工智能科学家加入啦!
快科技2月6日消息,据多方媒体报道,世界顶尖 AI 科学家许主洪正式加入阿里巴巴了,担任阿里集团副总裁,负责 AI To C 业务的多模态基础模型及 Agents 相关基础研究与应用解决方案
2025-02-06 10:43:00