• 我的订阅
  • 头条热搜
近日,全球用户量近10亿的社交软件“电报”创始人帕维尔•杜罗夫,在法国布尔被捕,引发全球猜测。X平台所有者马斯克要求释放杜罗夫,并连发多文讽刺欧洲没有言论自由。斯诺登也发文称法国逮捕杜罗夫是对基本人权的...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题,限制了模型的泛化能力和实际应用范围。近日,来自于香港科技大学(广州)、南方科技大学、...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
本文转自:人民网研究院一、案例概述农业银行大模型ChatABC,对于大模型精调、提示工程、知识增强、检索增强、人类反馈的强化学习(RLHF) 等大模型相关新技术进行了深入探索和综合应用,结合农业银行研发支持知识库、...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
【新智元导读】谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大...……更多
“GPT-N”一定更强吗?专家警告:当人类数据用完 AI大模型或将越来越笨
...丈夫一箩筐》海报放眼当下,以 ChatGPT 为代表的大型语言模型(LLMs),在一定程度上也成为了人类智力的克隆产物。而数据作为模型性能和泛化能力的重要基础之一,会直接影响这些“克隆人”的智能水平。如我们所知,用于...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...读】DIAMOND是一种新型的强化学习智能体,在一个由扩散模型构建的虚拟世界中进行训练,能够以更高效率学习和掌握各种任务。在Atari 100k基准测试中,DIAMOND的平均得分超越了人类玩家,证明了其在模拟复杂环境中处理细节和进...……更多
...设施练就“最强大脑”本报记者 曹政如果把人工智能大模型比作一位小学生,那么数据训练时所用的“语料”和“算力”,就相当于小学生“刷题”时使用的习题册和计算器,帮助他掌握知识点、更快给出正确答案。如今,北...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
PICO已经积灰了,苹果头显就不会了吗?
...不温不火的AR/VR赛道AR/VR的热潮总是一阵一阵,当去年AI大模型横空出世,将2023年命名为“AI元年”后,AR/VR就开始陷入漫长的沉寂。IDC最新发布的《2024年中国AR/VR市场十大洞察》中显示,2023全年,中国AR/VR市场全年出货预计24万...……更多
雷军呼吁共建更良性汽车市场舆论环境/华为北汽享界 S9 曝光/OpenAI 加持机器人亮相
...公司 Figure 发布了他们与 OpenAI 的合作成果,将 OpenAI 的大模型运用在其机器人 Figure 01 上。据介绍,OpenAI 大模型加持的 Figure 01 机器人现在可以与人全面对话。OpenAI 模型为机器人提供了高级视觉和语言能力,Figure 自身的神经网...……更多
数字化,人类时空价值的重塑
...献出版社 2023年10月版■ 何适2023年,以ChatGPT为代表的大模型应用成为数字科技领域的新风口。比尔·盖茨在采访中表示ChatGPT出现的意义不亚于互联网和个人电脑的诞生。人工智能的浪潮扑面而来。而上一次,如此点燃人们想象...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
训练数据超20亿 云从科技视觉大模型刷新四项世界纪录
近日,云从科技在视觉大模型上取得重要进展,行人基础大模型在PA-100K、RAP V2、PETA、HICO-DET四个数据集上从阿里巴巴、日立等多家知名高校、企业与研究机构脱颖而出,刷新了世界纪录。其中最高在PA100K上的Fine-tuning准确率达...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...景理解、图像分析、机器人感知和图像分割等。语义分割模型是计算机视觉领域中的一种模型,旨在将图像中的每个像素分配给特定的语义类别。与传统的图像分类模型只能给整个图像分配一个类别不同,语义分割模型能够为图...……更多
“百模大战”下,刮起了MaaS的风
百模大战的背景下,越来越多的大模型厂商开始讲起了“MaaS”的新故事。这一概念为开发者和企业提供了一种全新的方式,以更高效的方式利用人工智能模型,而无需从零开始进行训练和部署。随着技术不断进步,MaaS正逐渐成...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...力于推动人工智能领域的技术创新和发展。数据是大语言模型(LLMs)成功的基石,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源,模型参数量 130 亿,可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP,用户可在 AI 应用中的「AI 视频」板块申请试用。腾讯...……更多
...发,为Flower的框架和生态系统提供动力。公司旨在解决AI模型训练工程中对公共数据(主要是网络数据)的依赖,并在近期推出训练大语言模型(LLM)的联邦学习方法——FedGPT。Flower lands的创始人——剑桥大学(University of Cambridge)的科...……更多
火山引擎发布大模型训练视频预处理方案 已应用于豆包
10月15日消息,火山引擎在视频云技术大会上发布了大模型训练视频预处理方案。目前,该技术方案已应用于豆包视频生成模型。火山引擎总裁谭待在活动致辞表示,在AIGC、多模态等技术的共同推动下,用户体验在多个维度上经...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型...……更多
又一超级巨头宣布:裁员上万人!
...对公司大幅下滑的业绩。 在裁员1.1万人之后,MetaCEO扎克伯格曾发部了一则道歉视频,在视频中扎克伯格说:“疫情期间各行各业增长很快,Meta 认定这种增长会一直持续,因此扩大了规模。现在证明,这种过度乐观是错的”,...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
Scaling Law百度最早提出!OpenAI/Claude受它启发,致谢中有Ilya
...统团队。他们探讨了深度学习中训练集大小、计算规模和模型精度之间的关系,并且通过大规模实证研究揭示了深度学习泛化误差和模型大小的缩放规律,还在图像和音频上进行了测试。只不过他们使用的是 LSTM,而不是Transforme...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
作者|黄楠编辑|袁斯来大模型今天所展示出的强大能力,源于背后海量数据,为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。百度云智算大会他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:在应用层,大模型理解、生...……更多
更多关于国际的资讯:
国际乒联混团世界杯半决赛 中国对阵韩国名单出炉
12月7日,2025年国际乒联混合团体世界杯半决赛,中国队将对阵韩国队。第一盘:王楚钦/孙颖莎vs吴晙诚/崔孝珠第二盘:蒯曼vs金娜英第三盘:林诗栋vs张禹珍第四盘:蒯曼/王曼昱
2025-12-07 11:26:00
印度靛蓝航空取消数千架次航班 大量乘客滞留
因印度政府颁布新规导致飞行员排班困难等问题,印度靛蓝航空公司连续5天取消航班数千架次,导致大量乘客滞留机场。仅5日一天
2025-12-07 08:22:00
据美国地质调查局地震信息网消息,格林尼治时间6日20时41分(北京时间7日4时41分),美国阿拉斯加州亚库塔特以北约90公里处发生7.0级地震,震源深度10公里。
2025-12-07 08:23:00
当地时间6日,乌克兰总统泽连斯基在社交媒体上表示,其与乌军总参谋长格纳托夫、乌国家安全与国防委员会秘书乌梅罗夫以及美国特使威特科夫和美总统高级顾问库什纳进行了长时间且内容丰富的电话会谈
2025-12-07 07:52:00
近日,“百年西泠·中国印”特展在马来西亚吉隆坡举办,当地民众在篆刻体验中感受中国艺术的魅力,延续着源远流长的文化交流。这是西泠印社全年“金石舟楫”航行的其中一站
2025-12-07 07:52:00
尽管家园遭创,巴勒斯坦足球队仍在赛场奋勇争先。他们在12月1日的阿拉伯杯揭幕战中,以1-0击败东道主卡塔尔队,随后又于12月4日与突尼斯队打平
2025-12-07 07:52:00
当地时间12月5日,2026年美加墨世界杯决赛阶段抽签仪式在美国首都华盛顿举行。最终抽签结果如下:A组:墨西哥、南非、韩国
2025-12-06 08:18:00
贵州日报天眼新闻记者 田芳编辑 安刚二审 谢佳杰三审 成嘉廷
2025-12-06 22:07:00
拾光纪·习近平主席同马克龙总统交流互动的经典瞬间
人民日报客户端讯 从尼斯夜谈、豫园茶叙,到松园会晤、驿站畅谈,再到在都江堰友好交流,习近平主席同马克龙总统的交流互动留下一幕幕经典瞬间。
2025-12-06 15:59:00
2026年米兰-科尔蒂纳冬奥会火炬本土传递6日上午在罗马正式启动。来源 新华社编辑 徐然二审 李劼三审 周文君
2025-12-06 22:39:00
华商网讯 据中国驻菲律宾大使馆微信公众号消息,2025年12月6日,新任中国驻菲律宾大使井泉抵菲履新。菲外交部官员、中国使馆外交官到机场迎接
2025-12-06 14:45:00
当地时间12月6日凌晨,巴基斯坦总理新闻发言人穆沙拉夫·扎伊迪发文证实,巴基斯坦与阿富汗在边境地区爆发激烈交火。此外,阿富汗政府发言人穆贾希德发布消息说
2025-12-06 08:18:00
新任中国驻菲律宾大使井泉抵菲履新
中国网12月6日讯 据中国驻菲律宾大使馆消息,12月6日,新任中国驻菲律宾大使井泉抵菲履新。菲外交部官员、中国使馆外交官到机场迎接
2025-12-06 10:43:00
新华社快讯:12月5日,国家主席习近平在四川省成都市都江堰同法国总统马克龙举行非正式会晤。
2025-12-05 14:55:00
中国网12月5日讯 据国防部网站消息,12月5日下午,国防部新闻局副局长、国防部新闻发言人蒋斌大校就近期涉军问题发布消息
2025-12-05 16:13:00