• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
联通元景大模型亮相2024年中国品牌日 打造产业智能化新范式
...参与中国品牌日活动,并在联通展馆精彩亮相联通元景大模型,充分展示大模型的核心能力及对各行业的颠覆性影响。能说、擅听、会看的联通元景大模型联通展台前热闹非凡,参观者络绎不绝。联通一位工作人员以实操+讲解的方...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
2024年过半,大模型、AIGC这场考试,你交卷了吗?成绩如何?大模型厂商们虽然把价格战“卷”出了白菜价——普通开发者或许会为低价疯狂,但企业用户关心的依旧是产品、应用与自身业务的匹配度;大模型是否能够真正解决...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
Microsoft Start Networks中国内容生态伙伴峰会成功举办
...态正在加速重构。作为全球内容产业的重要参与者和体验革新者,微软在技术迭代下致力于构建强大的内容生态体系—— MSN ,赋能高质量内容的跨区域流动与创新。通过此次盛会,微软旨在联结更多用户及产业合作伙伴,深入...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...力、自主学习和自我改进等多个层面对人工智能技术带来革新性突破。(英伟达科学家Jim Fan、图灵奖得主Yann LeCun等参与讨论OpenAI的Q*实现方式) (Meta科学家田渊栋则认为Q*是Q-learning和A*的结合,且天然地适合推理任务,尤其在...……更多
...解问题。这一方法最早应用于计算机视觉领域的图片生成模型。朱毅鑫说,当时计算机视觉领域有一类难题叫作“什么是纹理”。比如,两张有着明显差别的纹理图片,如果用计算机视觉进行逐个像素的比对,就会认为是不一样...……更多
大模型价格战“卷”向何方?|深度
...应用,或许才是国内大模型生态可持续发展之道。▍算法革新与模型优化才是价格战背后真正推手让人始料不及的是,国内率先掀起大模型价格战的是一家“不务正业”的量化私募巨头——幻方。这些年国内金融量化交易异军突...……更多
...业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语...……更多
浙江电信成为 “西湖之光”算力联盟首批成员,助力打造AI for Science科研新范式
...,中电信人工智能科技有限公司董事长何忠江作《电信大模型实践与思考》主旨报告,介绍了中国电信在通用大模型领域的最新成果--星辰系列大模型,该系列大模型涵盖语义、语音、多模态三大方向,已经在政务、医保等领域...……更多
大模型赋能机器狗 西工大离线具身智能研究取得新突破
...。西北工业大学供图李学龙教授团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出大模型离线具身智能导盲犬,并实现了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。该成果进一步展示了使...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。作为具备强大工具使用能力的大...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将会给搜索产品带来全新变化,推...……更多
ai终端产业创新论坛在沪举行
...别和判断的问题。可以看出,终端的创新将会给用户带来革新性的体验,进而加速智能终端的渗透,从而更快创造良好的创新生态系统。”(业内首个AI终端产业生态联盟启动筹备)AI终端生态重塑的过程,离不开行业规范和企...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
首届中国大模型大会在北京举行
本文转自:人民网首届中国大模型大会会议现场。主办方供图人民网北京6月20日电 (焦磊)大模型作为人工智能领域的技术新高地,正加速赋能千行百业。6月18日至19日,以“中国大模型之路”为主题的首届中国大模型大会(CL...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生...……更多
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
李开复露面的频率越来越高,都是因为大模型。没有上周发布会上精致讲究的穿搭和标志性的领带,这次李开复只是一件西服配上衬衫就出现在摄像头前,显得有些仓促。“昨晚技术团队看到这个突破很激动,我们就迫不及待...……更多
...加码这一人工智能发展的最新形态,用“百模千态”全面革新生产力,加速行业数智化转型升级。近日,华为开发者大赛——百模千态开源大模型AI挑战赛决赛(以下简称“AI挑战赛”)在华为云开发者日北京站活动上举行。大...……更多
同一天2篇Nature!清华两团队最新科研突破!
...进而利用300个离子量子比特实现可调耦合的长程横场伊辛模型的量子模拟计算长程横场伊辛模型是一类重要的量子多体模型有助于理解量子信息、凝聚态物理等领域的基本问题也可用于求解优化问题等现实应用 典型300离子长程...……更多
更多关于科技的资讯:
估值一年翻17倍,巨头创企疯狂涌入,AI搜索火爆了
智东西12月2日报道,当前AIGC能力正不断向网页、PC桌面端、手机App和端侧硬件渗透,微信聊天框内容搜索、相册图片检索
2024-12-03 12:04:00
大疆的又一次搅局,给创作者带来了真正的「小蜜蜂」
适合所有创作者的「小」麦克风。从 2022 年下半年开始,每当提及领夹式无线麦克风这个产品品类,都很难忽略大疆作为「鲶鱼」下场
2024-12-03 13:32:00
骁龙8s Elite再次被确认:性能区间已清晰,新机时间也已确认!
说到手机性能的时候,感觉没有多少用户会提起性能过剩这句话了,原因也很简单,那就是很多新功能都需要强悍的算力。尤其是今年下半年
2024-12-03 13:32:00
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生
2024-12-03 13:33:00
图结构转文本序列,大模型直接读懂!图推理性能大涨
大语言模型直接理解复杂图结构的新方法来了:将图(Graph)转换为适合Transformer架构的线性token序列。belike
2024-12-03 13:33:00
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在
自我博弈,很神奇吧?我们终于朝着真正自主、自我完善的人工智能迈出了重要一步?上周末,一篇 Google DeepMind 的论文引发了 AI 圈的关注
2024-12-03 13:34:00
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
11 月 22 日,Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号,他们开源了一切
2024-12-03 13:34:00
全球五大巨头GPU总量曝光!2025年等效H100或超1240万块
【新智元导读】AI巨头的芯片之争,谷歌微软目前分列一二。而xAI作为新入局者,正迅速崛起。这场竞争中,谁会成为最后赢家
2024-12-03 13:34:00
百元投影 “卷王” 登场!哈趣 Q1 深度评测,性价比究竟有多能打?
追剧已经成为了日常生活中的必备节目,追剧也有很多姿势,火车上追剧、床上追剧、厕所里追剧、飘窗上追剧……等等各种场景,还有些人喜欢窝在沙发里
2024-12-03 13:34:00
清华UCSD提出全新微调方法,8B小模型媲美GPT-4o!科学问题正确率提高28%
【新智元导读】最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型
2024-12-03 13:34:00
电竞利器:双飞燕M760有线游戏耳机深度评测,249元到手
在当今的电子竞技世界里,拥有一款性能卓越的游戏耳机是每一位玩家的梦想。头戴式游戏耳机以其出色的隔音效果、沉浸式的音效体验以及舒适的佩戴感成为了众多游戏玩家的首选
2024-12-03 13:34:00
月收入暴增476%,红利正当时,语聊转向东南亚再探社交新蓝海
语聊不只在沙特大有可为,在印尼也同样有市场。作为东南亚人口最多、GDP最高的国家,印尼的年轻活力凸显。较高的互联网普及率
2024-12-03 13:35:00
美国双11,TikTok放弃和Temu拼低价
今年黑五,字节麾下的TikTok试图 绕开拼多多海外版Temu的低价优势,踩下了“正面硬刚”的急刹车。如同国内抖音上线比价频道
2024-12-03 13:35:00
851个零件复刻全球最贵光刻机!ASML推出High NA EUV乐高套装:售价1650元
快科技12月3日消息,光刻设备制造商ASML近日在其官网纪念品商城推出了一款特别的产品——High NA EUV光刻系统TWINSCAN EXE:5000的乐高模型套装
2024-12-03 13:37:00
告别玩手机晕车!荣耀300系列全球首发360度全场景晕动舒缓显示
快科技12月2日消息,荣耀300系列延续了"祖传"的护眼屏幕,不仅仅对视觉友好,甚至还加入了防晕车功能。荣耀300系列全球首发360度全场景晕动舒缓显示
2024-12-03 13:38:00