• 我的订阅
  • 头条热搜
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...具体而言,研究团队先是提出了一个语言模型数据比较新基准——DCLM。之所以提出这一基准,是因为团队发现:由机器学习 (ML) 模型从较大的数据集中自动过滤和选择高质量数据,可能是构建高质量训练集的关键。因此,团队...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...多种操作技能。在实验中,RoboMamba 在通用和机器人评估基准上展示了出色的推理能力,如图 2 所示。同时,我们的模型在模拟和现实世界实验中展示了令人印象深刻的操纵位姿预测能力,其推理速度比现有的机器人 MLLMs 快 7 倍...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...该工作首先引入了 Intention-in-Interaction(IN3)这一全新的基准测试,旨在通过与用户明确的交互来理解用户的隐式意图。以 Mistral-7B 为框架,基于 IN3 训练的 Mistral-Interact 能主动评估任务的模糊性,询问用户意图,并在启动下游智...……更多
...间歇性闪烁。PugetBench在某些AdobePremierePro测试中,Extended基准测试可能无法完成。TopazVideoAI在使用某些模型进行视频增强时可能会遇到错误。具有Arc核显的酷睿Ultra处理器:《阿凡达:潘多拉边境》(DX12)在游戏加载过程中可能...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...参数的 LLM 原型 ——Grok-0。这个早期模型在标准 LM 测试基准上接近 LLaMA 2 (70B) 的能力,但只使用了一半的训练资源。之后,他们对模型的推理和编码能力进行了重大改进,最终开发出了 Grok-1,这是一款功能更为强大的 SOTA 语...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
...上最好的开源大模型”据Meta介绍,Llama 3已经在多种行业基准测试上展现了最先进的性能,提供了包括改进的推理能力在内的新功能,是目前市场上最好的开源大模型。在架构层面,Llama3选择了标准的仅解码(decoder-only)式Transfo...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...的对比,“我们对系统进行了非常彻底的分析,并进行了基准测试。谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力。”哈萨比斯略带微...……更多
加码折叠屏手机赛道 vivo探路新质生产力发展
...第一,这也是vivo连续三年蝉联国产品牌第一。根据中国信通院近日发布的统计数据,2023年1~12月国内市场手机总体出货量累计2.89亿部,同比增长6.5%。中国智能手机市场复苏正带动全球智能手机市场向好。手机产业引领“新质...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...最快抵达成功的方式。xAI在首页展示了Grok-1和其他模型的基准测试对比连“中国AI教父”李开复也没躲过捷径的诱惑。这位互联网的多年从业者,创新工场的掌舵人,同样不愿意错过风口。他在2023年3月宣布组建自己的大语言模...……更多
星纪魅族集团加入中国信通院APP认证签名体系建设
10月26日消息,星际魅族应用分发平台在23日与中国信通院APP签名服务系统正式完成技术对接工作,进一步为用户的数据隐私安全保驾护航。当前,国内移动互联网发展迅速,各类软件APP对促进数字经济发展、便利群众生产生活...……更多
...问题的能力。此外,在广泛使用的“大型语言模型”32项基准测试中,“双子座”Ultra版本在30项中达到目前最先进水平。不过,也有报道指出,“双子座”Ultra版本并没有完全碾压OpenAI的GPT-4,也在其他一些行业基准测试项目中...……更多
李飞飞最新报告:美去年AI领域私人投资是中国近9倍,中国仍是美最大竞争对手
...Google在内的人工智能领先开发商主要根据不同的人工智能基准来测试他们的模型。这种做法使得系统比较和判断人工智能模型存在的风险和局限性的工作变得更加复杂。4.经济生成式AI领域投资激增。据统计,尽管去年人工智能...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...没有Sora公测……OpenAI只是发了新版大模型代码能力测试基准。就在网友们的耐心被耗光的时候,剧情反转来了。创业公司MultiOn AI的创始人Div Garg现身认领: 草莓哥账号其实是我们家最先进的AI Agent控制的,快来和它在线互动吧...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...理各种文本生成任务。从结果来看,Falcon Mamba 7B 在一些基准上超越同尺寸级别的领先模型,包括 Meta 的 Llama 3 8B、Llama 3.1 8B 和 Mistral 7B。 Falcon Mamba 7B 分为四个变体模型,分别是基础版本、指令微调版本、4bit 版本……更多
戴尔以技术创新推动AI基础架构升级
...计都是为了确保GPU在服务器内达到运行状态。在AI的公开基准测试中戴尔PowerEdge表现优异。MLPerf是当前AI领域关注度和参与度的计算性能基准测试,在去年9月份发布的MLPerf Inference V3.1的推理基准测试中,共有26个厂商提交了超过13...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...mons 的一部分,在这里它与学者们一起开展跨行业 AI 安全基准研究。谷歌还表示,它积极向美国国家科学基金会的国家人工智能研究资源试点项目等项目贡献计算信用等工具和资源,该试点项目旨在使美国的人工智能研究民主化...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...模型在短短一年时间内就取得了令人瞩目的进展,在多个基准测试中展现出了优于GPT-4的能力,尤其是在代码开发、科学推理等场景中的卓越表现。更重要的是,Claude在安全性方面表现出色,能有效防止大模型”越狱”(突破安全限制...……更多
智能澎湃!浩鲸科技再次登榜 “人工智能领军企业”
...项,并依托20余年技术积累、实践和洞察,深度参编中国信通院《面向行业的大规模预训练模型技术和应用评估方法 第2部分:电信行业大模型》标准制定,从电信行业场景丰富度、能力支持度、应用成熟度三方面,与电信运营...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...动评分器 ( FLAMe-RM 和 FLAMe-Opt-RM)。在12个自动评分器评估基准中的8个基准上,FLAMe及其变体的自动评分性能优于用专有数据训练的GPT-4o、Gemini-1.5-Pro等模型。- 计算高效的多任务训练:引入了一种计算更为高效的方法,使用创新...……更多
年轻人的「AI自由」,是它给的
...也曾满怀炽烈地搓手机、打键盘、拨号上网一样。据中国信通院统计,目前,全球AI大模型共有1328个。其中美国占比44%,中国占比36%。过去一年半,中国科技公司造出了上百个大模型,以及浩瀚如满天繁星的AI应用。AI以一种既...……更多
阿里云的AI路线图
...。大模型的到来或许让阿里云看到了新的增长点。据中国信通院《云计算白皮书(2023年)》,2022年,全球云计算市场规模为4910亿美元,增速19%,预计在大模型、算力等需求刺激下,市场仍将保持稳定增长,到2026年全球云计算...……更多
浪潮星锐英才高传集:向前一步,就会有答案
...其团队同样敢为人先,打造的浪潮云原生平台已通过中国信通院云原生成熟度模型评估,达到L4/L4+级别认证,位列国内前三,并正式成为“云原生安全实验室”成员单位。在赛迪顾问发布的《2022-2023年中国云安全市场研究年度报...……更多
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...ma7B(参数数70亿),尽管其参数数量较少,但据称在关键基准测试中表现出色,并明显超过了一些更大的模型。此外,与同类规模的其他开源模型相比,Gemma也表现出优势。谷歌表示,与其他开源模型相比,Gemma在同类尺寸模型...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...。谷歌声称,Gemma模型18个语言理解、推理、数学等关键基准测试中,有11个测试分数超越了MetaLlama-2等更大参数的开源模型。GoogleDeepMind的首席执行官DemisHassabis表示,Gemma是在同类尺寸中性能最佳的模型。Gemma与Llama2、Mistral基准.……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...型参数量和训练token数的最佳比率。如果你希望在论文的基准测试中得到最优模型,那么Chinchilla本身没有问题;但Meta要发布的旗舰模型还需要更高的推理效率。因此,我们选择增加训练的token数,并增加训练时长,让模型达到「...……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...别是:中山大学的DDopS、浙商银行的系统随机生成、亿阳信通股份有限公司aiboco三支队伍。中原银行的zybank_aiops、南开大学的尊嘟假嘟战队、华为技术有限公司的轻舟队、北京城建智控科技股份有限公司的UCI四支队伍获得优秀奖...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...,提升其与用户的交流能力和情感认知。Inflection-2在多项基准测试中表现优异,击败了LLaMA-2、PaLM 2 Large等模型,但在两项测试中落后于GPT-4。(来源:“新智元”微信公众号)《大模型版“5年高考3年模拟”来了!6141道数学题,...……更多
看病就用支付宝:支付宝推出“AI健康管家”,让AI长出“手和脚”
...、以及千万级高质量医疗知识图谱。在中英文医疗考试、基准测试中,它能达到或超过GPT4水准。其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中,位列A榜第一、B榜第二。同时,蚂蚁医疗大模型采用全栈自研医疗多模态结构、...……更多
...行业对跨行业共建共享的理解,近日,中国铁塔联合中国信通院发布《电信基础设施跨行业共建共享研究报告(2023年)》。报告认为,实施电信基础设施跨行业共建共享,推进社会各行业资源双向开放共享和融合创新应用,不...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。在腾讯全球数字生态大会上,腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线...……更多
更多关于科技的资讯:
大升级!微信内测接入DeepSeek-R1
快科技2月15日消息,多位网友在社交平台上发布截图,微信正在小范围灰测接入DeepSeek-R1,有部分用户已经内测到了相关AI搜索功能
2025-02-15 23:23:00
印度宣布要加速研发五代战机:俄罗斯送大礼引围观 欲转让苏-57技术
2月15日消息,据国外媒体报道称,俄罗斯打算转让自己的技术,让印度可以自行生产苏-57战斗机。报道中提到,俄方提议可以在印度生产苏-57战斗机
2025-02-15 16:53:00
《美国队长4》豆瓣开分仅5.4分:无聊得让人直打瞌睡
2月15日消息,《美国队长4》豆瓣开分仅5.4分。截至发稿,共有14336人进行了打分,其中超过83%的观众给出了3星及以下评价
2025-02-15 16:53:00
骏强智能携手智能大屏 IPTV 重磅登陆 2025 春节联欢
当璀璨烟花点亮守岁夜空,当万家灯火映照团圆笑靥,亿万中华儿女正通过智能大屏共享这场年度文化盛宴。2025年中央广播电视总台春节联欢晚会的璀璨舞台上
2025-02-15 16:56:00
OPPO首款磁吸编织数据线来了:用完自动缠绕 主打一个优雅
快科技2月15日消息,今天OPPO宣布,旗下首款磁吸编织数据线将于2月20日19点发布。这款数据线采用磁吸设计,长度1米
2025-02-15 17:23:00
升维高考院重新定义高考:叶锋博士为教育改革提供了新的思路
在中国教育领域,高考始终是一个无法回避的话题。每年六月,这场考试都牵动着数百万家庭的心。然而,在108度公益基金会叶锋博士看来
2025-02-15 18:11:00
何小鹏为三对小鹏MONA车主证婚:现场见证新人领证
快科技2月15日消息,在情人节当天,何小鹏来到民政局当证婚人,现场见证三对小鹏MONA车主领证结婚,何小鹏还送上祝福:祝愿他们夫妻恩爱
2025-02-15 18:23:00
产业一线 |失去的右手回来了!脑机接口等待“特斯拉时刻”
中新经纬2月15日电 (林琬斯)“00后”周键脱下智能仿生手后,中新经纬看到,他穿戴的接受腔(连接身体和假肢的部分)内
2025-02-15 18:49:00
互联网迷惑行为:女生一小时两度上演“卡凳杀”
快科技2月15日消息,近日,网络上又现“迷惑行为”新例。起初,众人还以为是有人不慎被“封印”,未曾想竟是在网上流行起来的“塑料凳套头”挑战
2025-02-15 18:53:00
DeepSeek翻译“他强任他强 清风拂山岗”等:网友看完就问老外服不服
2月15日消息,据国内媒体报道称,我国外交部长王毅最近的发言中,引用了多句中国古语,其中还包括中国武侠泰斗金庸先生在小说里曾写到的两句话
2025-02-15 18:53:00
华为最强小折叠!曝华为Pocket 3最快3月登场
快科技2月15日消息,博主定焦数码爆料,华为Pocket 3预计在3月底4月初登场,这款新品将会和华为智能手表一起发布
2025-02-15 19:23:00
电视台重播《甄嬛传》:剪掉余答应戏份
2月15日消息,据媒体报道,北京卫视正在重播电视剧《甄嬛传》,有网友发帖称,余莺儿相关戏份被剪掉。据了解,《甄嬛传》余莺儿扮演者崔漫莉自曝曾在横店镇拍戏时
2025-02-15 19:23:00
比亚迪:2027年全固态电池批量装车 2030年大规模量产
快科技2月15日消息,在第二届中国全固态电池创新发展高峰论坛上,深圳市比亚迪锂电池有限公司CTO孙华军进行了发言。孙华军透露称
2025-02-15 19:53:00
为什么不建议打工人周末早起 研究发现周末补觉是正确之举
快科技2月15日消息,据媒体报道,南京医科大学一项观察性研究提示,对于工作日睡眠不足的人来说,周末补觉是正确之举,可能有助降低心血管疾病风险
2025-02-15 19:53:00
coser还是对饺子导演下手了:仿妆秀引发热议
2月15日消息,据媒体报道,因《哪吒2》爆火,coser们开始模仿电影中的角色,甚至能看到coser模仿导演饺子。对此
2025-02-15 19:53:00