• 我的订阅
  • 头条热搜
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语言模型,在 HumanEval 编码任务中达到了 63.2% 的成绩,在 MMLU 中达到了 73%。xAI 使用了...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...,浪潮信息的存储解决方案已经在互联网企业大模型训练推理场景、大型AI算力中心与某国家重点实验室中落地。例如,在大模型场景训练中,浪潮信息通过增加全闪存储帮助客户实现效率提升,将断电续训时间降低到分钟级别...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...上线。▲文心大模型4.0 Turbo API开放同时,飞桨平台发布新一代飞桨框架3.0 Beta版本,具备大模型训推一体、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...参数划分为多个组别而实现的计算的稀疏化,即每次执行推理任务时,根据对输入类型的判断,MoE模型会通过门控网络选择性地激活神经网络中最契合指令的专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率...……更多
...科大的研究机构并非偶然。“德清是全国县域唯一的国家新一代人工智能创新发展试验区和国家级车联网先导区,这为我们研究院在人工智能领域的研究与产业化落地提供了良好的土壤。”接下来,德清阿尔法研究院将继续围绕...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...1.0亮点主要包括五个方面:最先进的性能测试结果,新的推理以及创意功能,性能强大且高效的 AI 超算系统,责任与安全,以及可用性。首先,性能测试方面,在32个性能基准测试中的30个中,Gemini Ultra模型超越了现有最先进的G...……更多
人工智能基础大模型“九天”广州发布
...累超1.6万个DICT行业项目经验,牵头承担“智慧网络国家新一代开放创新平台”等16项国家级重大项目。本次大会期间,中国移动还将升级九天•客服、九天•政务2款行业大模型,新增发布九天•网络、九天•企业通话、九天•...……更多
...包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。据测试机构透露,豆包等大模型能准确运用求导公式和三角函数定理,但是面对较为复杂的推导和证明问题就很难继续得分。重点考查实验探究...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...种硬件感知推测解码算法,可以加快 Mamba 和混合模型的推理速度。 论文地址:https://arxiv.org/pdf/2408.15237该研究的性能最佳模型是从 Llama3-8B-Instruct 中蒸馏出来的,在 AlpacaEval 2 上相对于 GPT-4 实现了 29.61……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...已经超越了大模型的“近似检索”性质,提升到了“近似推理”层次。并且在论文中,o1全程被称作LRM(Large Reasoning Model,大型推理模型),而非一般大型语言模型的LLM。o1团队的核心成员Noam Brown也转发了这项研究,顺便给o1-prev...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...凡的性能而获得了前所未有的关注。然而, LLM 的训练和推理成本高昂,人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发,他们通过为 LLM ...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...出手了,这次又是重磅炸弹。昨晚,DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview,直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(codeforces)等权...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
... Qwen2.5-Turbo在长文本、短文本任务评测集上均表现优秀在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到68秒,实现了4.3倍的速度提...……更多
化学:强化归类研究 明确命题追求
...生在“宏微结合”“变化平衡”等思想观念指引下的证据推理、模型认知、科学探究与符号表征等能力素养状况以及科学态度、社会责任等个性品质与价值观念发展水平。这样的命题追求是指导并统领命题的行动指南。毫无疑问...……更多
全新开源王者!NVIDIA悄然推出70B AI模型:力压GPT-4o、仅次于OpenAI o1
...,Nemotron-70B基于Llama-3.1-70B开发,在没有专门提示和额外推理token的情况下,Nemotron-70B也能答对复杂的推理问题,如“草莓有几个r”的经典难题。业内人士评价,NVIDIA在Llama 3.1基础上训练出的这个不太大模型,能够超越GPT-4o和Claud.……更多
9.11比9.9大?多个大模型翻车!业内人士:就是偏科,文科强理科弱
...文认为,模型产生幻觉的三大来源:数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式,如位置接近性、共现统计数据和相关文档计数,从而导致幻觉。此外,大模型还可能会出现长尾知识回忆不足、难以...……更多
老黄祭出史上最强 AI 芯片B200!30倍性能提升,AI 迎来新摩尔定律时代|钛媒体AGI
...芯片——Blackwell GB200,将于今年晚些时候发货。GB200采用新一代AI GPU(图形处理器)Blackwell,是英伟达A100/H100系列AI GPU的继任者。在大语言模型推理工作负载方面,Blackwell的性能相比H100 GPU提升了30倍,能耗却降低了25倍。亚马逊……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...本,模型被要求独立回答100次。然后,使用最佳N法随着推理次数的增加获得模型的回复准确性。结果如图4中的右图所示。作者观察到,随着推理次数的增加,所有模型的回复准确性都有所提高,并最终达到一个上限。这对于中...……更多
智谱AI的双轨驱动:从基座大模型出发,以共创理念推进商业落地
...单。经历过多次升级迭代,2024年1月,智谱AI正式推出了新一代基座大模型GLM-4,整体性能相比上一代大幅提升。GLM-4可支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,逼近DALLE-3。当...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
OpenAI发布免费新品GPT-4o:可对音频、视觉和文本实时推理,与人自然对话,功能秒杀Siri
...方面尤其出色。GPT-4o可以在音频、视觉和文本中进行实时推理,接受文本、音频和图像的任何组合作为输入,并生成文本、音频和图像的任何组合进行输出。它可以最短在232毫秒内响应音频输入,平均为320毫秒,这与人类在对话...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。然而,推理能力的提升真的能解决...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。云厂商的降价策略,不仅是对当前市场的一次重大推动,更是对未来商业智能化转型的一次深远布局。阿里云智能...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...。夸克大模型也将是持续推动夸克App产品体验创新和迈向新一代搜索的技术底座。夸克大模型性能评测夺冠四大能力提升用户效率日前,阿里巴巴智能信息事业群发布全栈自研、千亿级参数的夸克大模型,将应用于通用搜索、医...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
...的32项学术基准中,从自然图像、音频和视频理解到数学推理,“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称,在图像识别领域的测试结果显示,“双子座”Ultra性能优于迄今最先进的人工智能模型,具有天然多...……更多
中国科技创新“乘”数直上
...一句话。讯飞星火是科大讯飞公司在2023年5月正式发布的新一代认知大模型,从发布至今历经多次迭代,不断升级核心能力的技术底座,持续赋能各行各业。目前,讯飞星火在国务院发展研究中心国研经济研究院、新华社研究院...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...及应用国家工程研究中心、中国人工智能产业发展联盟、新一代人工智能产业技术创新战略联盟、大模型测试验证与协同创新中心4家机构联合指导,并邀请《智能制造》杂志、通信产业报、金融新观察、动脉网等行业媒体作为...……更多
更多关于财经的资讯:
重磅!风电、光伏等电力碳足迹因子数据发布!
中国风电新闻网讯: 1月17日,生态环境部联合国家统计局、国家能源局印发了《关于发布2023年电力碳足迹因子数据的公告》
2025-01-25 01:32:00
中广核中选葫芦岛市省管海域80万千瓦海上风电项目
中国风电新闻网讯:1月24日,葫芦岛市发改委发布关于葫芦岛市省管海域80万千瓦海上风电项目竞争配置结果的公示,经评审专家组综合打分排序
2025-01-25 01:34:00
格力电器获得发明专利授权:“拼装式底盘、风扇”
证券之星消息,根据天眼查APP数据显示格力电器(000651)新获得一项发明专利授权,专利名为“拼装式底盘、风扇”,专利申请号为CN201911109874
2025-01-25 03:16:00
凯迪股份获得实用新型专利授权:“一种直流电机电流保护电路”
证券之星消息,根据天眼查APP数据显示凯迪股份(605288)新获得一项实用新型专利授权,专利名为“一种直流电机电流保护电路”
2025-01-25 03:16:00
中国铁建获得实用新型专利授权:“一种嵌键式定位线夹”
证券之星消息,根据天眼查APP数据显示中国铁建(601186)新获得一项实用新型专利授权,专利名为“一种嵌键式定位线夹”
2025-01-25 03:16:00
常青股份获得实用新型专利授权:“一种便于脱模的汽车油箱冲压模具”
证券之星消息,根据天眼查APP数据显示常青股份(603768)新获得一项实用新型专利授权,专利名为“一种便于脱模的汽车油箱冲压模具”
2025-01-25 03:16:00
大华股份获得发明专利授权:“补光控制电路及图像采集设备”
证券之星消息,根据天眼查APP数据显示大华股份(002236)新获得一项发明专利授权,专利名为“补光控制电路及图像采集设备”
2025-01-25 03:16:00
国家电网CHGRID 4.375 05/22/43价格上涨1.185%报91.080
1月25日由国家电网发行的CHGRID 4.375 05/22/43现价91.080上涨+1.185%收益率5.133%。本文源自:金融界AI电报/阅读下一篇/返回网易首页下载网
2025-01-25 03:17:00
金山办公获得发明专利授权:“一种基于模版的文档编辑方法和装置”
证券之星消息,根据天眼查APP数据显示金山办公(688111)新获得一项发明专利授权,专利名为“一种基于模版的文档编辑方法和装置”
2025-01-25 03:17:00
XD长江电获得实用新型专利授权:“一种基于滑环室的红外测温系统”
证券之星消息,根据天眼查APP数据显示XD长江电(600900)新获得一项实用新型专利授权,专利名为“一种基于滑环室的红外测温系统”
2025-01-25 03:17:00
马钢股份获得发明专利授权:“一种联轴节柱销拆卸装置”
证券之星消息,根据天眼查APP数据显示马钢股份(600808)新获得一项发明专利授权,专利名为“一种联轴节柱销拆卸装置”
2025-01-25 03:17:00
XD长江电获得发明专利授权:“一种卡扣式断路器锁具及锁定方法”
证券之星消息,根据天眼查APP数据显示XD长江电(600900)新获得一项发明专利授权,专利名为“一种卡扣式断路器锁具及锁定方法”
2025-01-25 03:18:00
同星科技获得实用新型专利授权:“一种换热器翅片及换热器”
证券之星消息,根据天眼查APP数据显示同星科技(301252)新获得一项实用新型专利授权,专利名为“一种换热器翅片及换热器”
2025-01-25 03:18:00
三一重能获得实用新型专利授权:“一种风机塔筒段结构及风力发电机组”
证券之星消息,根据天眼查APP数据显示三一重能(688349)新获得一项实用新型专利授权,专利名为“一种风机塔筒段结构及风力发电机组”
2025-01-25 03:18:00
*ST中利获得发明专利授权:“地上采矿工程用卷绕拖拽电缆及生产工艺”
证券之星消息,根据天眼查APP数据显示*ST中利(002309)新获得一项发明专利授权,专利名为“地上采矿工程用卷绕拖拽电缆及生产工艺”
2025-01-25 03:19:00