• 我的订阅
  • 头条热搜
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...存在显著的性能差距,尤其在处理更多样化或异质的训练语料库时,这一差距会进一步扩大。语料库的异质性意味着数据集的多样性,由于内容和风格各异,往往会引入干扰。PEFT 方法对此尤为敏感,在异构情况下性能损失更为...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...-STaR的具体性能,研究使用了可用的最佳开放语言模型Lean语料库 (InternLM2-Math-base-7b) 上进行预训练,并遵循Lean的Mathlib作为底层训练集的标准实践。首先以LeanDojo Benchmark 4 v9作为监督微调(SFT)数据集,包含超过23.1万个示……更多
杭州一公司开20万月薪抢AIGC算法工程师;SpaceX「星舰」发射任务失败;华为宣布实现ERP自主可控,突破封锁|极客头条
...在第六位。Reddit 联合创始人兼 CEO Steve Huffman 称该平台的语料库非常有价值,他们不再想将其免费提供给科技巨头。Reddit 修改了 API 访问政策,它的 API 对开发机器人程序等工具的独立开发者,以及学术和非盈利项目的研究员仍...……更多
360税务行业标准大模型入选人民网数造新实体典型案例
...税集团30多年涉税服务领域专业知识,搭建起完善的训练语料库,涵盖超百万法规、千万案例判例、万余本税务电子书以及百亿税务行业汉字集。据测试,税务行业标准大模型在注册税务师考试中的成绩已经超越了ChatGPT,获得业...……更多
AI赋能智慧服务,嘉银科技推出“女娲”坐席辅助平台
...服团队积极拥抱AI变革,探索AI应用,并成立专项小组,推进语料库建设、模型验证、业务运营,力求精益求精,给客户带来优质高效的服务。未来,嘉银科技将继续加强自主研发能力建设,持续迭代优化产品、服务和技术能力。乘着人工...……更多
值得买科技发布全面AI战略,AI驱动的电商变革者?
...方面,AIGC的研发和应用需要基于海量优质的数据资源和语料库,而这正是值得买科技的优势,来自过去数年的积累。与此同时,在此次战略发布会上,“1个大模型、2个数据库、3个引擎、4类应用”组成的值得买科技AI产品矩阵...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...这类模型专注于特定行业的需求,通过使用高质量的行业语料库进行训练,以实现对行业知识的深入理解和应用。浙江大学人工智能研究所所长、求是特聘教授、国家杰青获得者吴飞分享了智海系列垂直领域大模型与人工智能体...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的优势。 ...……更多
马斯克旗下人工智能大模型Grok已正式开源
...服务访问。然而,Grok 的开源并不包括其训练数据的完整语料库,也不提供对 X 上可用的实时信息的访问。用户仍然需要订阅 X 的付费版本。Grok 被定位为 OpenAI 的 ChatGPT 和其他领先的谷歌AI的竞争对手。它以意为理解的俚语命名...……更多
...通话测试和研究的新领域,创建国内第一个地方手语词汇语料库及网站,让听力、视力残障人士也能考普通话证书,更好参与社会生活。“10年前,当第一个盲人、聋人向我们提出进行普通话测试诉求时,给我们提出了一个创新...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...情绪识别。“语音频谱图的语音数据集选自CASIA汉语情感语料库,它是由中国科学院自动化所录制,包括四个专业发音人,生气、高兴、害怕、悲伤、惊讶和中性等六种情绪,共4800句不同发音。”团队成员彭华东介绍。如此,“...……更多
用AI识别AI:西湖大学一项研究可高效检测AI生成文本
...器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有...……更多
...开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反映了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道:“它们是否也反映了人类在推理测试中的认知偏差?”她...……更多
热词生动记录中国人生活
...胺穿搭、命运的齿轮开始转动、新职人。专家表示,监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源,分析的语料规模超过80亿字符。王小岩认为,网络新词新语或是偶有出现的旧字新说,彰显出汉语的旺盛...……更多
...学习框架等底盘和基础性共性关键技术,建设高质量国家语料库,实现软硬件全栈式能力覆盖。强化前瞻引领性研究,力争在前沿领域抢占制高点。瞄准可能引发人工智能变革的颠覆性方向,加强人工智能与数学等相互促进,突...……更多
2023内容科技应用典型案例:人民日报创作大脑AI+发布
...、促进生成式人工智能在媒体行业的安全应用的主流价值语料库建设,展现出其助力用主流价值导向驾驭算法的能力与潜力。(天津大学新媒体与传播学院院长陆小华) ……更多
...发展,该公司的数据许可业务将继续增长。“Reddit的信息语料库对于大型语言模型的训练非常重要,”她说,并补充说,随着人工智能生成的内容变得普遍,该网站19年来有组织和有节制的内容将变得更有价值。 ……更多
最前线 | APUS发布千亿级天燕大模型AiLMe,toC应用发力,toB服务蓄力
...态;在数据层面,AiLMe的训练数据主要来源于互联网公开语料库、互联网公开网页数据、APUS在服务中积累的产品数据和行业数据四个渠道;在算力层面,APUS在郑州和新加坡分别部署了几千台CPU服务器,为AiLMe的训练提供充足的算...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...调和对齐(alignment)。预训练预训练通常需要极其庞大的语料库,使模型了解语言的一般结构。Llama 3.1、GPT-4这种通用LLM,一般需要互联网规模的数据。而特定领域的LLM(如几何学、放射学、电信行业等)则需要注入相关的领域...……更多
“AI”当选柯林斯年度词汇
...技一般。”报道称,柯林斯表示,文字专家分析了柯林斯语料库,这个资料库涵盖超过200亿个单 字,其中包含来自全球各地网站、报章杂志和书籍的 书面资料。柯林斯也从广播、电视和日常对话搜集口语素材, 按月将新资料输...……更多
...键要素为算力、算法、数据、生态,其中数据方面,中文语料规模和质量还在追赶英文资料。 ……更多
沪指跌0.71%,创指跌1.85%:两市成交逾8500亿...
...跃题材哑火;传媒板块逆势走强,抖音概念股大涨,中文语料库、光刻机、旅游板块造好。至11月16日收盘,上证综指跌0.71%,报3050.93点;科创50指数跌1.67%,报887.11点;深证成指跌1.23%,报9954.4点;创业板指跌1.85%,报1978.12点。Wi...……更多
人工智能与传统彩灯碰撞出“AI年兽”
...。我们在百度智能云客悦智能对话平台的基础上,开展了语料库训练、年兽人设定制、交互界面开发、灯组联调测试等一系列工作,最终保障了灯会开园时AI交互功能的正式上线投用。”百度智能云高级产品运营经理吕岳鹏介绍...……更多
强强联手,九章云极“算力包”引领全行业创新算力服务新篇章
...式实现智能体构建,赋能业务。同时,平台推出了高质量语料库平台,汇聚了包括新华体系数据在内的各类行业数据,及AIGC标注数据、合成数据,解决垂直领域模型训练的数据资源瓶颈。为了让大模型训练和推理获得更为便捷...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...理的检索模式,通过智能体对话式引导,并结合行业知识语料库,引导用户办事,简化流程,为用户提供即问即答、即问即办的‘一站式’政策服务。”南威软件集团人工智能与数据服务业务群总裁唐鹏飞介绍基于南威白泽大模...……更多
...方面,AIGC的研发和应用需要基于海量优质的数据资源和语料库,而这正是值得买科技的优势,来自过去数年的积累。在此次战略发布会上,“1个大模型、2个数据库、3个引擎、4类应用”组成的值得买科技AI产品矩阵,首次整体...……更多
首批认证!有连云获信通院数字化软件产品服务能力优秀级认证
...处于严格的安全合规状态,并通过有连云自身庞大的金融语料库对垂直模型进行专项训练,融合AI、NLP与大数据,智能驱动每一个环节,形成快速、高效的金融文本、视频及多维数据反馈,辅助金融机构和上市公司商业决策,实...……更多
中国工程科技知识中心,打造工程科技“智”高点
...和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练;探索科研新范式,充分依托各类数据库与知识库,推进跨学科、跨领域协同创新,以数据驱动发现新规律...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...疑。主要的问题是数据污染和泄露,例如,GPT-3 的预训练语料库中包含了 Children\'s Book Test 数据集,LLaMA-2 也提取了 BoolQ 数据集网页内容。而这些数据集也是许多测试的内容。研究人员接着发现,数据的重合和泄漏会导致大模型...……更多
美国执念抹黑他国 恰似人工智能“幻觉”
...型、算法等方面的局限,一个重要原因是用于训练模型的语料库中存在偏见等问题,算法也难以纠正。在美国一些人脑子里,对中国产生“幻觉”的原因与此类似,那就是针对中国的种种政治偏见。他们整日所想就是怎么样攻击...……更多
更多关于科技的资讯:
ChatGPT击败50名人类医生!疾病诊断准确率达90%
用ChatGPT诊断疾病,准确率已经超过了人类医生?!斯坦福大学等机构进行了一轮随机临床试验,结果人类医生单独做出诊断的准确率为74%
2024-11-19 09:43:00
英伟达GB200 NVL72面临过热问题,或将更改设计及延迟发货
11月18日消息,据 The Information 报道,英伟达(Nvidia)最新一代的 Blackwell GPU在安装在大容量服务器机架中时
2024-11-19 09:43:00
华为Mate X6最新参数曝光:配色达5款 配5000万主摄
【CNMO科技消息】11月18日,华为Mate品牌盛典正式官宣,将于11月26日举行。根据此前的消息,基本可以确认的是
2024-11-19 09:43:00
AI能办专属信用卡了,Agent自己赚钱自己花,OpenAI合作伙伴打造
现在,给AI办张银行卡,它就能帮我们完成最终支付了?!事情是这样的。支付公司Stripe(也就是Chatgpt的支付服务商)专门为AI智能体发布了一个接口
2024-11-19 09:43:00
收到了15元的暖风机,结结实实的翻车,还好客服很给力
大家还记得上周三我写的15元壁挂暖风机吗?上周六我就收到了,可谓是有喜也有愁,今天就写写这玩意。我是13号第一批下单的
2024-11-19 09:43:00
月底新机发布会扎堆!华OV米齐发力 Mate70系列领衔
【CNMO科技消息】11月的手机市场虽然不如10月那般热闹纷呈,但依然不乏亮点,将有五款新机登场,它们分别是OPPO Reno13系列
2024-11-19 09:44:00
Redmi K80系列下周发布 全系升级大满贯2K屏
【CNMO科技消息】11月18日,Redmi「新国屏时代」技术沟通会在广州召开。Redmi品牌总经理王腾、小米手机部显示触控部总经理吴仓志
2024-11-19 09:44:00
两千档起步?骁龙8至尊版大战天玑9400,两款性价比神机齐杀到!
随着新的一周开启,手机圈大战又开启了新篇章。在之前发布的一众天玑9400和骁龙8至尊版新机里,3599起的真我GT7 Pro是一枝独秀
2024-11-19 09:44:00
华为Mate70系列预约超187万:市场期待值拉满了
昨日,备受瞩目的华为Mate70系列智能手机正式在华为商城及各大电商平台启动预约。此次发布的Mate70系列包括Mate 70
2024-11-19 09:44:00
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-11-19 09:48:00
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
在 LLM 应用不断迭代升级更新的当下,图灵奖得主 Yann LeCun 却代表了一股不同的声音。他在许多不同场合都反复重申了自己的一个观点
2024-11-19 09:48:00
​首个自主机器学习AI工程师,刚问世就秒了o1,Kaggle大师拿到饱
多智能体系统,可自动化整个 ML 工作流程,节省数千小时工时。Open AI 的推理模型 o1,这么快就被比下去了?本周五
2024-11-19 09:48:00
钻石冷却的GPU即将问世:温度能降20度,超频空间增加25%
现阶段这一方案的前景如何?我们尚不得而知。未来 GPU 的发展方向,居然和钻石有关系?近日,一家名为 Akash Systems 的公司已与美国商务部签署了一份初步备忘录
2024-11-19 09:48:00
继良品率低后,英伟达Blackwell又过热,说好的明年初发货呢?
发言人将「工程迭代」称为「正常且在意料之中」。今年的的 GTC 大会,英伟达将 AI 芯片的标杆推向了难以想象的高度。为了帮助世界构建更大
2024-11-19 09:49:00
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
【新智元导读】DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务
2024-11-19 09:49:00