• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
...解问题。这一方法最早应用于计算机视觉领域的图片生成模型。朱毅鑫说,当时计算机视觉领域有一类难题叫作“什么是纹理”。比如,两张有着明显差别的纹理图片,如果用计算机视觉进行逐个像素的比对,就会认为是不一样...……更多
...业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语...……更多
大模型赋能机器狗 西工大离线具身智能研究取得新突破
...。西北工业大学供图李学龙教授团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出大模型离线具身智能导盲犬,并实现了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。该成果进一步展示了使...……更多
浙江电信成为 “西湖之光”算力联盟首批成员,助力打造AI for Science科研新范式
...,中电信人工智能科技有限公司董事长何忠江作《电信大模型实践与思考》主旨报告,介绍了中国电信在通用大模型领域的最新成果--星辰系列大模型,该系列大模型涵盖语义、语音、多模态三大方向,已经在政务、医保等领域...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。作为具备强大工具使用能力的大...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将会给搜索产品带来全新变化,推...……更多
ai终端产业创新论坛在沪举行
...别和判断的问题。可以看出,终端的创新将会给用户带来革新性的体验,进而加速智能终端的渗透,从而更快创造良好的创新生态系统。”(业内首个AI终端产业生态联盟启动筹备)AI终端生态重塑的过程,离不开行业规范和企...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生...……更多
...加码这一人工智能发展的最新形态,用“百模千态”全面革新生产力,加速行业数智化转型升级。近日,华为开发者大赛——百模千态开源大模型AI挑战赛决赛(以下简称“AI挑战赛”)在华为云开发者日北京站活动上举行。大...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...化。作为面向下一代生成式AI输入法,讯飞输入法13.0首先革新人机交互界面,对于传统输入推荐区赋以全新的“活力视界”设计理念,在屏幕与按键之间采用双行显示,创新卡片式推荐,支持自由组合卡片功能,实现Feed流式的...……更多
大模型追不上了?不妨尝试把主战场放在垂直模型
...已经研发“中文版Sora”:一款名为Boximator的创新性视频模型。紧接着,字节快速辟谣,积极否认。从阴谋论角度来看,有没有一种可能是字节在蹭Sora的热度。说句扎心的话,这个谣言不辟也罢。毕竟字节的“套壳”尴尬还历历...……更多
...科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被该模型颠覆的观点。那么,这到底是一个怎样的模型?具有哪些出色的能力?又将会给哪些领域带来...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
文|王怡宁编辑|邓咏仪 尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GP...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
本文转自:劳动报商汤科技发布日日新5.0大模型五大产品全新亮相 局部能力赶超GPT-4本报讯(劳动报记者 陈宁)日前,在上海商汤临港AIDC举行的“2024年商汤技术交流日”活动现场,商汤发布行业首个“云、端、边”全栈大模...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
更多关于科技的资讯:
Steam最新调查:RTX 3060王者无敌!RTX 4060移动版第二
快科技11月3日消息,Steam 2024年10月硬件调查已经出炉,RTX 3060仍然是最为流行的显卡,RTX 4060移动版意外高居第二
2024-11-03 23:07:00
本文转自:人民网-陕西频道人民网西安11月3日电(记者李志强)11月3日,国家重大科技基础设施“先进阿秒激光设施(西安部分)”建设正式启动
2024-11-03 18:45:00
一种会让牙齿掉光的病!很多人年轻时都不重视
关于牙齿健康,世界卫生组织曾提出过一个“8020”概念,指 80 岁的老年人至少应该存留有 20 颗健康可以使用的天然牙
2024-11-03 19:07:00
给大象争取\
Happy,是“服务于”美国纽约布朗克斯动物园的一头亚洲象,五十多岁了,它在这个动物园居住了几十年。可以说,它从小就是在人类的饲养环境中
2024-11-03 19:07:00
新一代便宜主板来了!B860、B850、B840傻傻分不清
快科技11月3日消息,Intel、AMD的新一代平台都已到来,但是都只有旗舰级主板,无论是Z890还是X870E/X870都很昂贵(当然AMD更好一些还能选择上代主板)
2024-11-03 19:37:00
中国研制原子钟6000万年误差小于1秒:可支撑6G、7G通信发展
快科技11月3日消息,据报道,在中国科学院国家授时中心,安放着中国自主研制的原子钟,这是世界上目前在应用的最先进计时设备
2024-11-03 19:37:00
为什么蝙蝠可以吊着睡觉 其他动物就不行
蝙蝠可以挂着睡,最重要的原因是它们的体重足够轻。其它动物如果体重也足够轻,同时能像蝙蝠那样不费力地支撑自己倒挂,那么它们也可以倒挂着睡
2024-11-03 20:07:00
一周了 酷睿Ultra 200S在德国一颗都没卖出去!
大家都知道,德国玩家非常偏好AMD,以致于到了非常离谱的地步。德国最大的零售商MindFactory公布了最新一周的CPU处理器销量数据
2024-11-03 20:07:00
雷军今晚举行“迟到的直播”,讲述小米征战纽北的故事。雷军在直播中表示,小米15 打破了售价3999元的束缚,“3999元对我们是个心魔
2024-11-03 20:23:00
苹果2024款Macmini于10月29日发布,搭载M4/M4Pro芯片,内存16GB起步。配备M4的Macmini起售价为 4
2024-11-03 20:24:00
彭博社记者马克・古尔曼昨晚发表了最新一期的《PowerOn》时事通讯,提到苹果正在逐渐放弃“年更”式的产品发布策略。“苹果公司正在逐步放弃每年一次的产品升级周期
2024-11-03 20:29:00
realme今日宣布,真我GT7Pro首发搭载realmeUI6.0,支持4年系统更新维护。升级内容如下:流体云2.0
2024-11-03 20:30:00
据媒体报道,在ICPC(国际大学生程序设计竞赛)上,华为CEO任正非与ICPC主席、教练及获奖选手举办座谈会。任正非在会上被问到
2024-11-03 20:31:00
美商海盗船发布K70 PRO TKL磁轴机械键盘:快速触发设计
快科技11月3日消息,美商海盗船宣布,将其MGX Hyperdrive霍尔效应磁轴带入到K70 PRO TKL机械键盘
2024-11-03 20:37:00
红魔10pro预热首发,1.5k无孔全面屏
红魔官方今天为新机红魔10Pro预热,号称是全面屏史上最高分辨率。目前红魔10Pro系列已经获得入网许可,其型号是NX789J
2024-11-03 20:42:00