• 我的订阅
  • 头条热搜
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(具体详见论文)。得出了以下几个有见地的发现:1. 更大规模的模型有更好的校准性能我们要求模型在回答问题时提供 0 到 100 的信心指数,以衡量模型的校准程度,即模型对其答案的自信程度。理想的校准模型应该是信心指...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...直接在笔记本电脑上运行。性能表现方面,Gemma7B在MMLU(大规模多任务语言理解)测试中取得了64.3%的高分,而之前的佼佼者Mistral7B得分为62.5%,Meta的Llama-27B和13B模型也有所不及。此外,Gemma还在HuggingFace和HuggingChat平台上上线……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...在中国电子学会2023科学技术奖评选中,腾讯混元《面向大规模数据的Angel机器学习平台关键技术及应用》获科技进步一等奖。基于领先的模型能力积累,腾讯混元大模型正在积极推进内部应用落地,让大模型创造更多价值,目前...……更多
腾讯版“GPT-4o”来了!混元Turbo首发并上线,效率翻倍价格砍半
...产品(简称“5T”),兼容国内主流的芯片厂商,在多个大规模的集群上稳定运行,落地覆盖金融、交通、政务、互联网、医疗、传媒等多个行业,积累了丰富的融合创新实践。数据库TDSQL产品能力不断突破,能提供业界领先的...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...而言比 MuJoCo 和 Robosuite 要快至少十倍。该环境主要用于大规模多智能体任务中的安全学习。五、应用、挑战与展望应用前景安全强化学习在许多关键领域都有着广泛的应用前景:自动驾驶:通过安全强化学习算法,可以在复杂...……更多
CVPR’24 Navsim挑战赛冠军方案!
...种新型的端到端自动驾驶框架 Hydra-MDP。在 CVPR 2024 NAVSIM(大规模端到端驾驶)挑战赛中,Hydra-MDP 获得了第一名和创新奖,并且在 nuPlan 基准测试中的表现优于当前最先进的规划器。 Hydra-MDP 框架采用新颖的多教师、学生-教师知...……更多
中国科技创新“乘”数直上
...飞星一号”平台,在此基础上,讯飞星火大模型开启了更大规模的训练。 目前,基于“飞星一号”的讯飞星火V3.5已完成训练,并于1月30日发布。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、多模态等方...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
... MMLU、BBH),采用不同的学习策略。MixCon 性能与类似或更大规模的先进公开模型相当或更优,尽管总参数比 Llama - 2 少,但作为稀疏模型,其活跃参数仅 5B,处理长序列时 KV 缓存仅需 2GB,而 Mixtral 需 32GB(如表 2 所示)。消融实...……更多
百融云创荣获“2024大模型创新应用奖”
...复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模,并不等于更强模型能力。产业大模型考验的是算力+行业know-how+模型精调的综合能力。其中行业know-how尤为关键,这是专家经验、行业知识、组织能力、工程能力的...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...以提高性能。MMMU-Pro:更健壮的MMMU重新审视MMMU基准测试大规模多学科多模态理解和推理(MMMU)基准测试是一个综合性的数据集,能够评估多模态人工智能模型在需要特定学科知识和深思熟虑推理的大学水平任务上的表现。MMMU由...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...方言语音合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示...……更多
...然场景,人工智能在教育领域的应用前景非常广阔,能让大规模因材施教成为可能。继全球首个虚拟人口语教练Hi Echo后,有道近期也将推出一款全新大模型应用,更好地助力学习效率提升。3月26日至29日,博鳌亚洲论坛2024年年...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...完善,很多学者的目光聚焦于如何帮助大模型处理和感知大规模的私有数据库。RAG(Retrieval-Augmented Generation)系统采用检索方法,从私有数据库中高效、准确地召回与查询高度相关的信息内容,用以增强通用大模型处理查询的语...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...上甚至超越了人类设计师,同时支持精确的RGB颜色控制和多语言识别。自去年以来,文本到图像生成模型取得了巨大进展,模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。Playground Research最近发布了一篇论文,详细...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到了2.1版本。最受瞩目的首先是Qwen-72B,参数达到720亿...……更多
易联众发布民生信息服务大模型平台,助推民生事业提质增效
...等细分业务场景出发,引入具体行业知识和业务逻辑进行大规模自学习训练,自动挖掘行业知识,进而提高大模型的准确度和专业性。此外,易联众“智鼎云帆”行业大模型融合“智鼎天宫AI平台”已有的AI原子能力,可通过行业插件、...……更多
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
...应迅速的聊天机器人,能够处理大量用户互动。这对需要大规模互动的客户服务、电商和教育平台尤为有价值。 3. 数据提取和标注:Claude 3.5 Haiku能够高效处理和分类信息,使其在快速数据提取和自动化标注任务中表现出色。此...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评测指标与方法》语言大模型的相关技术要求,通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究院发起,...……更多
谷歌Gemini大模型的“先进”表现如何?一文告诉你
...了超越当前时代的“先进结果”,成为第一个在MMLU上(大规模多任务语言理解)超过人类专家的模型。该模型在数学、物理、历史、法律、医学和伦理等57个学科上取得了90.0%的成绩。明年初,谷歌还将推出全新升级的Bard Advanced...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不降反增,多了0.1T。https://……更多
Llama3.1训练平均3小时故障一次,H100万卡集群好脆弱
...个含16384块Nvidia H100 80GB GPU集群上进行训练的。虽说针对大规模系统有句老话:唯一确定的就是会出故障。但这一问题还是引起不少网友关注。放慢速度,check一下产品吧。 老出故障,咋整?具体来看,在419次意外中断中,148 次...……更多
Meta大模型LLaMA 3即将登场,参数量或达1400亿
...ormation4月8日发布的报道,作为对标GPT-4的大模型,LLaMA3的大规模版本参数量可能超过1400亿,而最大的LLaMA2版本的参数量为700亿。LLaMA3将支持多模态处理,即同时理解和生成文本及图片。值得注意的是,LLaMA3将延续Meta一直以来的...……更多
2023年度十大科技名词揭晓!你都知道哪些?
...ive AI生成式人工智能是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。这项技术能够创造文本、图片、声音、视频和代码等多种类型的内容,在各行业、各领域都具有广泛的应用前...……更多
AMD宣布49亿美元收购服务器制造商ZT Systems!
...地时间2024年8月19日,美国处理器大厂AMD宣布已与全球超大规模计算公司及AI 基础设施的领先提供商 ZT Systems签署收购协议,AMD 已同意以价值 49 亿美元的现金和股票交易收购 ZT Systems,其中包括根据某些交易完成后的里程碑支付...……更多
...中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质...……更多
用AI识别AI:西湖大学一项研究可高效检测AI生成文本
...样,机器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...“最先进的性能”,不仅击败了OpenAI的GPT-4,甚至在MMLU(大规模多任务语言理解)基准测试中,成为第一个超越人类专家的模型。如果这是真的,意味着什么?“这巨大飞跃将影响几乎所有的Google产品。” 要知道 Google是(至少...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...万字——一次性阅读百万字小说,并快速总结生成摘要。大规模产出、多模态交互、长文本阅读,这是“中文逍遥”的三个核心功能点。其核心目的都是准确体现作者的创作意图。而这一前提是,理解作者生活的土壤,理解读者...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...高级编码等领域都处在最前列。比如,Gemini Ultra在MMLU(大规模多任务语言理解数据集)中的得分率高达90.0%,这款MMLU数据集包含数学、物理、历史、法律、医学和伦理等57个科目,专门用于测试大模型的知识储备和解决问题能力...……更多
更多关于科技的资讯:
4.8万公里全球还有谁!2024年新开通14条高铁一览:有你家吗
2024年,又有多条普铁、高铁新线相继建成通车,全国铁路营业里程达到16.2万公里,其中高铁4.8万公里,傲居全球第一
2025-01-04 16:15:00
高弹耳带 振德医用灭菌口罩100只11.85元
天猫【认养一头牛旗舰店】振德医用灭菌口罩100只日常售价为 19.8 元,领取 3 元优惠券,叠加打折优惠,到手价为 11
2025-01-04 16:45:00
精选黄牛后腿 牧牛班熟食卤牛肉礼盒15元/袋发车
天猫【牧牛班食品旗舰店】牧牛班 南阳黄牛肉礼盒 150g*6 袋(熟食卤牛肉)日常售价 139 元,今日下单领取 39 元优惠券
2025-01-04 16:45:00
2024年观众高满意度影片榜单TOP25出炉:《热辣滚烫》排名第五
快科技1月4日消息,据中国电影艺术研究中心,中国电影观众满意度调查结果出炉。25部影片获2024年观众高满意度影片,前三名分别为《好东西》《飞驰人生2》《第二十条》
2025-01-04 17:15:00
粉丝自制RTX 5080公版渲染图:还挺帅的
快科技1月4日消息,近日,NVIDIA的一张宣传图疑似泄露了RTX 50公版卡的样式,和以往有很大不同,猜测大概率是RTX 5080/5070 Ti
2025-01-04 17:15:00
美国又将11个中国机构列入实体清单!还有巴基斯坦1个
美国的实体清单(Entity List)又变长了!2025年1月3日,美国商务部工业与安全局(BIS)通告,将中国、缅甸
2025-01-04 17:45:00
曾在空军服役!韩国遇难机长最后画面:伸手摸向操控面板
1月4日消息,最近,一张疑似韩国济州航空遇难机长的最后画面曝光,引发网友热议。画面显示,客机用腹部着陆,即将撞上外墙前
2025-01-04 17:45:00
2024年新势力品牌KPI完成率:仅三家完成 小米不是最高
快科技1月4日消息,易车公布了2024新势力品牌KPI完成率榜单,能100%完成的仅三家:零跑、小米、理想。根据这份备受瞩目的榜单
2025-01-04 18:45:00
Intel提升不大!AMD游戏本之王锐龙9 9955HX3D配备144MB缓存
2023年7月,AMD发布了首款集成3D缓存的游戏本处理器锐龙9 7945HX3D,16个Zen4 CPU核心,总计144缓存
2025-01-04 20:15:00
传小马智行进入香港 官方:并未向其发放牌照
快科技1月4日消息,近日,有媒体报道称“小马智行Robotaxi抢攻香港,欲将服务拓展至香港市区”。小马智行也在采访中表示
2025-01-04 20:15:00
智能机器狗亮相贵阳黔灵山公园
今冬贵州怎么玩?来一场和AI机器人的邂逅!2025年元旦假期,贵州省文化和旅游厅指导开展“AI BOT贵州巡游”活动,科技感与趣味感十足
2025-01-04 20:31:00
高速上车辆故障 司机抗一床大红被当人肉警示牌 扣分罚款
在高速公路上遭遇突发状况时,正确设置警示标志是保障行车安全的关键步骤。然而,当随车必备的三角警示牌不翼而飞,一些车主便开始寻求替代方案
2025-01-04 20:45:00
天网+地网+金网!十堰科创与产业精准“相链”
十堰广电讯(全媒体记者 张欣 通讯员 江咸波 王宝卿)科创供应链平台建设是发展新质生产力、服务高水平科技自立自强的重大实践
2025-01-04 21:35:00
最高速度、最近距离!地球“掠过”今年最大的太阳
1月5日晚21点,地球又一次通过近日点,有三个“最”。这次地球在近地点时,距离太阳大约1.47亿公里,而到了7月份移动到远地点时
2025-01-04 21:45:00
人工智能AI机器狗亮相贵州西江千户苗寨
本文转自:人民网-贵州频道1月2日,“人工智能AI机器狗互动体验”展示活动在贵州西江千户苗寨景区精彩启幕,吸引众多游客前来参与体验
2025-01-04 15:36:00