• 我的订阅
  • 头条热搜
港中文团队提出大模型元推理范式,革新大模型的评价体系
曾忠燊,是一名潮汕人。其本科和硕士分别毕业于美国伊利诺伊大学和美国佐治亚理工学院。在本科毕业和硕士毕业之后,他曾先后在 IBM-Research 和深圳 IDEA 研究院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。借助这一方法可以大幅提升小模型...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...训练与推理、生成式AI与应用的基础设施激发“智能基建革新”,加速大模型和生成式AI落地《白皮书》以商汤基于AI大装置的多场景实践案例为例,阐述了从大型模型训练到生成式AI应用的全过程,再到区域智算中心的建设与运营,深...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
...项新技术,也将带来财富资管领域业务形态和逻辑范式的革新。 ……更多
...业股份有限公司(以下简称浪潮信息)发布千亿级开源大模型“源2.0”。“源2.0”创新采用局部注意力过滤增强机制(LFA),可以有效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语...……更多
大模型赋能机器狗 西工大离线具身智能研究取得新突破
...。西北工业大学供图李学龙教授团队将机器狗搭载离线大模型,应用在智能导盲场景,开发出大模型离线具身智能导盲犬,并实现了其智能人机交互、智能乘梯引导、智能过街引导、智能室内引导等功能。该成果进一步展示了使...……更多
浙江电信成为 “西湖之光”算力联盟首批成员,助力打造AI for Science科研新范式
...,中电信人工智能科技有限公司董事长何忠江作《电信大模型实践与思考》主旨报告,介绍了中国电信在通用大模型领域的最新成果--星辰系列大模型,该系列大模型涵盖语义、语音、多模态三大方向,已经在政务、医保等领域...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
商汤商量获SuperCLUE 9月评测总榜和子榜两项第一,AI智能体方向受瞩目
...决复杂任务,灵活搭建AI智能体应用,支撑企业的生产力革新。目前,商量SenseChat已经在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业与超过500家客户建立了深度合作。作为具备强大工具使用能力的大...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
依托数据、平台、知识增强等优势 夸克大模型降低问答幻觉率
...型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将会给搜索产品带来全新变化,推...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生...……更多
...加码这一人工智能发展的最新形态,用“百模千态”全面革新生产力,加速行业数智化转型升级。近日,华为开发者大赛——百模千态开源大模型AI挑战赛决赛(以下简称“AI挑战赛”)在华为云开发者日北京站活动上举行。大...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...化。作为面向下一代生成式AI输入法,讯飞输入法13.0首先革新人机交互界面,对于传统输入推荐区赋以全新的“活力视界”设计理念,在屏幕与按键之间采用双行显示,创新卡片式推荐,支持自由组合卡片功能,实现Feed流式的...……更多
大模型追不上了?不妨尝试把主战场放在垂直模型
...已经研发“中文版Sora”:一款名为Boximator的创新性视频模型。紧接着,字节快速辟谣,积极否认。从阴谋论角度来看,有没有一种可能是字节在蹭Sora的热度。说句扎心的话,这个谣言不辟也罢。毕竟字节的“套壳”尴尬还历历...……更多
...科技企业或科研机构面向公众正式开放自研的人工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将...……更多
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
...公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来,全世界网友正在对其进行广泛测试,并得出科研领域正在被该模型颠覆的观点。那么,这到底是一个怎样的模型?具有哪些出色的能力?又将会给哪些领域带来...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
文|王怡宁编辑|邓咏仪 尚恩一周纵览本周大模型厂商们依旧表现活跃。硅谷大厂方面,Meta更新了编程模型Code Llama 70B,是Code Llama系列中规模最大,性能最强的版本。一款名为“miqu-1-70b”的神秘模型现身Hugging Face,跑分接近GP...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
昇思MindSpore 2.3全新发布
...,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚AI产业界创新力量,推...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...博士生方俊峰和所在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 4000000 多个分……更多
中国财税GPT迎来最准确的大模型:小竹财税AI问世
2023年,小竹财税团队经过两年多的努力,在财税大模型领域取得了重大突破。ChatGPT技术兴起后,小竹财税团队积极探索并开发了一系列通用中文大模型。同年4月,他们开始研究多模态模型的应用。经过反复试验和调整,小竹...……更多
vivo发布自研蓝心大模型及蓝河操作系统、OriginOS 4
...1月1日,2023 vivo开发者大会上,vivo正式发布了自研蓝心大模型BlueLM、OriginOS 4、自研蓝河操作系统BlueOS。vivo副总裁、OS产品副总裁周围发布了“1+2+N”的智能系统体验。其中的1,即vivo自研通用大模型矩阵——蓝心大模型BlueLM;2,...……更多
...期长、自由度差等痛点。作为人工智能领域划时代的技术革新,AI大模型拓展了传媒、游戏、影视等诸多领域数字角色的想象空间。大模型强大的生成能力、流畅的自然交互方式将改变游戏的开发流程、重构游戏体验,这早已成...……更多
更多关于科技的资讯:
Cyan 青心意创“全面拟人”机器人 Orca Ⅰ 发布
IT之家 10 月 31 日消息,Cyan 青心意创(原“青心创新 / 萨恩异创”)于昨日发布了通用人形机器人 OrcaⅠ
2024-11-01 09:19:00
全球首款!东南大学研制出偏振体全息光波导AR眼镜“云雀”
IT之家 10 月 31 日消息,IT之家从东南大学官方微信公众号获悉,东南大学研究团队研发的全球首款偏振体全息光波导(PVG)AR 眼镜“云雀”问世
2024-11-01 09:20:00
三星 One UI 7 概览:升级图标、改善家长控制、AI 增强照片
IT之家 10 月 31 日消息,科技媒体 Android Headline 昨日(10 月 30 日)发布博文,展示了 One UI 7 系统的诸多新功能 / 新特性
2024-11-01 09:21:00
不再三星 Galaxy Z Fold6 手机独占,谷歌扩展Gemini AI分屏功能
IT之家 10 月 31 日消息,科技媒体 9to5Google 于 10 月 29 日发布博文,报道称谷歌向更多安卓平板
2024-11-01 09:21:00
4499元起,一加“十三香”来了,北京骑行导航到天津无需充电
4499元起,一加“十三香”Pro级旗舰手机正式发布!除了内存容量以外不分大中小杯,都是标准版的价格,全Pro的配置。而且发布即开售
2024-11-01 09:23:00
一只“手”,难倒人形机器人
智东西10月31日报道,就在昨天,波士顿动力放出了人形机器人Atlas在工厂已经上岗就业的视频。视频中的Atlas可以自主在两个地点移动
2024-11-01 09:26:00
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-01 09:27:00
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-01 09:27:00
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
当机器人也有潜意识。大模型固然性能强大,但限制也颇多。如果想在端侧塞进 405B 这种级别的大模型,那真是小庙供不起大菩萨
2024-11-01 09:28:00
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
全新大语言模型越狱攻击基准与评估体系来了。来自香港科技大学(Guangzhou)USAIL研究团队,从攻击者和防御者的角度探讨了什么因素会影响大模型的安全
2024-11-01 09:29:00
波士顿动力电驱机器人进厂打工,全程自主无遥控,50万人在线围观
登上油管热榜,吸引50万网友围观,波士顿动力人形机器人又放大招了——无远程遥控(Fully Autonomous),Atlas可完全自主打工了
2024-11-01 09:29:00
全球最大AI超算内部首次曝光!马斯克19天神速组装10万块H100,未来规模还将扩大一倍
【新智元导读】一文揭秘全球最大AI超算,解析液冷机架和网络系统的创新设计。这台全球最大AI超算Colossus由xAI和英伟达联手建造
2024-11-01 09:29:00
谷歌净利润猛增35%,AI引领未来,搜索巨头将何去何从?
【ITBEAR】随着科技行业的财报季落幕,全球科技巨头谷歌母公司Alphabet的成绩单引发了市场广泛关注。最新财报显示
2024-11-01 09:47:00
人形机器人的创新,到了什么程度?
自从马斯克下场开启人形机器人的话题以来,人形机器人迅速成为热门话题,大模型的出现更是加速了人形机器人产业的发展。炒菜、榨汁
2024-11-01 09:48:00
武汉光谷完成共享无人机全域覆盖:可用于摄影、喊话、采集监测
IT之家 11 月 1 日消息,IT之家从“中国光谷”公众号获悉,武汉光谷在全国范围内率先建设覆盖全区的低空共享无人机平台已完成建设
2024-11-01 09:48:00