• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
本周(4.8-4.14)AI界发生了什么?
...时间4月9日,谷歌、OpenAl、Mistral在24小时内,接连发布大模型重磅更新。谷歌正式发布了Gemini 1.5 Pro的多项更新,包括企业AI平台预览版本,首次上新音视频处理能力——最长可处理11小时的音频,或者1小时的视频。 OpenAl则又一...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
...业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语...……更多
大模型赋能机器狗 西工大离线具身智能研究取得新突破
...。西北工业大学供图李学龙教授团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出大模型离线具身智能导盲犬,并实现了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。该成果进一步展示了使...……更多
浙江电信成为 “西湖之光”算力联盟首批成员,助力打造AI for Science科研新范式
...,中电信人工智能科技有限公司董事长何忠江作《电信大模型实践与思考》主旨报告,介绍了中国电信在通用大模型领域的最新成果--星辰系列大模型,该系列大模型涵盖语义、语音、多模态三大方向,已经在政务、医保等领域...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。作为具备强大工具使用能力的大...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将会给搜索产品带来全新变化,推...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生...……更多
...加码这一人工智能发展的最新形态,用“百模千态”全面革新生产力,加速行业数智化转型升级。近日,华为开发者大赛——百模千态开源大模型AI挑战赛决赛(以下简称“AI挑战赛”)在华为云开发者日北京站活动上举行。大...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...化。作为面向下一代生成式AI输入法,讯飞输入法13.0首先革新人机交互界面,对于传统输入推荐区赋以全新的“活力视界”设计理念,在屏幕与按键之间采用双行显示,创新卡片式推荐,支持自由组合卡片功能,实现Feed流式的...……更多
大模型追不上了?不妨尝试把主战场放在垂直模型
...已经研发“中文版Sora”:一款名为Boximator的创新性视频模型。紧接着,字节快速辟谣,积极否认。从阴谋论角度来看,有没有一种可能是字节在蹭Sora的热度。说句扎心的话,这个谣言不辟也罢。毕竟字节的“套壳”尴尬还历历...……更多
...科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被该模型颠覆的观点。那么,这到底是一个怎样的模型?具有哪些出色的能力?又将会给哪些领域带来...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
文|王怡宁编辑|邓咏仪 尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GP...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
AI+智能制造 百度联手吉利开创汽车新质生产力新范式
...而向智能汽车的演变,则是科技对出行方式和体验的重大革新。全国乘用车市场信息联席会秘书长崔东树在讨论中国汽车未来发展趋势时曾表示:软件智能化是中国新能源汽车未来发展的关键。中国工程院院士、清华大学智能产...……更多
更多关于科技的资讯:
遵义金紫阳:用“科技 绿色 健康”锻造新“食”力
多彩贵州网讯 近年来,遵义金紫阳食品有限公司在科技创新、绿色生产等方面持续发力,不断提高生产效率和质量水平,以适应消费者新需求和市场新变化
2024-06-13 21:51:00
实习生 丁绍华 潍坊报道随着2024年山东省消费促进年的到来,潍坊市首届大型啤酒节将于6月21日拉开帷幕,此次活动将为市民带来一场丰富的文化盛宴
2024-06-13 22:09:00
北京商报讯(记者赵述评 王思琦)6月13日,时尚商业发布消息称,美国服饰品牌Calvin Klein位于巴黎香榭丽舍大道的全球首家旗舰店将于本周五开业
2024-06-13 22:21:00
6月13日体彩中奖号码公布
大皖新闻讯 6月13日晚,中国体彩官网更新当日开奖公告,具体如下:编辑 许正文
2024-06-13 22:42:00
小锅牛肉变小牛焖饭 贾国龙舍不掉的快餐梦
西贝餐饮集团(以下简称“西贝集团”)又开始折腾了。近日,西贝集团旗下部分贾国龙小锅牛肉(以下简称“小锅牛肉”)门店更名为西贝小牛焖饭与拌面(以下简称“小牛焖饭与拌面”)
2024-06-13 23:55:00
视频大模型 快手美图殊途同归
有图像视频业务傍身的互联网企业,加速奔向大模型。近日,快手正式上线视频大模型“可灵”并开始邀测,用户输入一段文字即可生成视频
2024-06-13 23:55:00
即时通讯系统的发展历程
即时通讯系统:助力高效沟通的利器随着互联网技术的飞速发展,即时通讯系统已成为现代社会沟通交流的重要工具。从个人社交到企业办公
2024-06-14 00:03:00
教你如何彻底关闭电脑上的弹窗广告
关闭电脑上的弹窗广告是一个让人感到烦恼的问题,但是通过一些简单的步骤和有效的工具,你可以轻松地解决这个问题。在这篇文章中
2024-06-14 00:04:00
华为平板pc级wps更新:新增6种常用字体
6月13日消息,华为平板PC级WPS应用今日迎来升级,新增常用字体、支持U盘访问编辑等功能。据介绍,华为PC应用引擎发布于2022年8月
2024-06-14 00:05:00
一体机专研主板cb4-8121全“芯”配置
随着消费者对PC电脑的集成性和简洁性的需求增长,市面上除了笔记本电脑、台式电脑、平板电脑等众多PC形态,衍生出了一种将显示屏与主机相结合的一体机电脑(AIO)
2024-06-14 00:11:00
故障根因分析的基本原理和方法
故障根因分析在能源管理中的应用研究摘要:能源管理是保证能源系统安全、可靠、高效运行的重要环节。故障根因分析作为一种系统性的问题解决方法
2024-06-14 00:14:00
nvidiageforcertx50系列移动端显卡阵容泄露
日前,NVIDIAGeForceRTX50系列移动端显卡阵容遭遇泄露,全系采用最新的GDDR7显存,最高显存容量可达到16GB
2024-06-14 00:29:00
影棚级变焦柔光环的vivos19pro体验
摄影师之所以被称为光影的艺术大师,是因为在摄影中,光与影是塑造影像、传达情绪、营造氛围和构建视觉叙事的核心要素。光线可以揭示物体的形状
2024-06-14 00:30:00
本文转自:天门日报本报讯(融媒体记者陈飞)6月13日,在位于九真镇的湖北鑫登服饰有限公司,第三方验货机构工作人员正在对一批新生产的连衣裙外观
2024-06-14 00:34:00
微软发布.net9preview5预览版更新
6月13日消息,微软于6月11日发布了.NET9Preview5预览版更新,通过TensorPrimitives和Tensor为用户提供了增强的AI功能
2024-06-14 00:43:00