• 我的订阅
  • 头条热搜
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...开的彻彻底底。这不,Meta一连放出三篇技术文章,从大模型适配方法出发,介绍了:如何使用特定领域数据微调LLM,如何确定微调适配自己的用例,以及如何管理良好训练数据集的经验法则。接下来,直接进入正题。适配大模...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。先来看一张其乐融融的图片(一眼AI):右边的小羊驼代表Llama,而左边的蛇(Mamba)也是我们的老熟人了。至于...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
...数字经济健康发展发挥重要促进作用。中国工程院院士、清华大学教授郑纬民作了主题发言。他认为,当前数字经济的热点是人工智能,人工智能的热点是大模型的训练与应用。关注大模型算力基础设施建设,要注意考虑好五个...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
...幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 AI 顶会 IJCAI2024 上发起举办,探讨如...……更多
Sora爆火引关注,清华一场教学实验拷问人机互动边界
...遇和挑战?AI+教育对于人才培育又意味着什么?寒假前,清华大学选修元宇宙发展与挑战课程的学生们,完成了一项特殊的结课作业——作业要求是用AI(人工智能)工具结合多学科知识解决问题,具体选题自拟,“越有创造性...……更多
首届青年科学家创新发展大会人工智能青年科学家论坛成功举办
...济南超级计算技术研究院首席科学家亚历山大·赖科夫,清华大学计算机系长聘教授、国家杰青翟季冬,山东计算机学会秘书长吴小羽,上海交通大学深圳研究院副院长易春雨,国家超级计算济南中心研究员赵志刚,开放城市共...……更多
...向高端的跨越。”中国人工智能学会(CAAI)副理事长、清华大学教授、国家杰出青年科学基金获得者孙春富说。 ……更多
浪潮KaiwuDB论文被数据库国际顶会ICDE2024录用
...响力。此次在荷兰召开的ICDE2024大会,吸引到北京大学、清华大学、中国人民大学、浙江大学、MIT、斯坦福等高校及全球知名科技企业参会,共同探讨数据库、数据处理领域的先进技术问题。近年来,数据库研究人员提出了多个...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
...,如何让大模型早日走进寻常百姓家成为行业一大命题。清华系人工智能初创公司面壁智能近日发布端侧模型面壁MiniCPM,探索破解大模型应用落地成本与门槛过高的行业痛点。所谓端侧模型,通俗来讲就是无需连接网络、无需...……更多
精确分级筛查精神疾病,脑机接口厂商「星愿智能」再获数百万元天使轮融资|硬氪首发
...数转换将其转为数字信号后,导入PC端,进一步利用AI大模型对不同信号与各类精神疾病的指标进行匹配,以此对“无病症、轻症、中症、重症”四类进行精确分级与筛查。现在,星愿智能已经研发出面向消费者的智能脑环,产...……更多
清华博士李一舟爆红后翻车:靠卖AI课年赚5000万 被指割韭菜
...AI一知半解却能“割韭菜”赚钱李一舟为湖南长沙人,是清华大学工业设计和设计创新方法专业、设计战略与原型创新研究所博士。当然,李一舟的博士也有点水分。李一舟本硕就读于湖南大学,博士才就读于清华大学,而且,...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...数据增强方法由于其缓解过拟合的特性,而被广泛使用在模型训练过程中,例如图像的旋转、缩放、颜色的改变等等。然而,美国东北大学三年级博士生张一天和所在团队发现作为图像色彩的一个重要属性,色调(Hue)的变化却...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
大江东|中国智·惠世界,这场大会探寻AI全球治理最优解
...理,开展了一系列国际性、跨领域、多视角的深入研讨。清华大学人工智能国际治理研究院院长薛澜认为,人工智能在技术发展、应用方面带来的风险集中在三个方面:第一,技术内在问题,包括自主人工智能系统从长远来讲对...……更多
佛山“冲4”:科创平台的“新增量”
...强化“创新佛山”品牌形象2月28日,中国科学院院士、原清华大学校长顾秉林,中国工程院院士、广东省科学技术协会主席、中国科学院广州能源研究所研究员陈勇,中国科学院院士、南京大学教授邹志刚等20多位院士、100多位...……更多
科技资讯|建筑机器人自行建造巨大石墙;新型智能材料可应用于结构智能减振技术
...时首次用生物丝取代了绝缘材料。 首个多腔心脏类器官模型问世心脏病每年导致1800万人死亡,但新疗法的开发面临瓶颈,且到目前为止,还没有整个人类心脏的生理模型。现在,奥地利科学院分子生物技术研究所(IMBA)研究...……更多
人报甘头条  |  兰州大学研究团队在揭示氧化钌晶体微观磁结构方面取得重要进展 ​
...旋劈裂力矩相关研究工作 [Phys. Rev. Lett. 128, 197202 (2022)](清华大学宋成与兰州大学范小龙共同通讯)后取得的又一个重要研究成果。兰州大学物理科学与技术学院博士生冯晓玉为论文第一作者,范小龙教授为通讯作者。论文合作...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...模型涌现能力以及 GPT-4 的研究。Shengjia Zhao,本科毕业于清华,随后前往斯坦福攻读博士学位,22 年毕业之后就来到 OpenAI。个人介绍中显示,热衷于训练大模型,他是 ChatGPT、GPT-4、GPT-4o mini 的核心作者之一。任泓宇,2018 年毕业...……更多
华中科技大学白翔教授发布多模态大模型
...技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可以同时...……更多
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
...上的文生视频,更多的还是图生视频。如腾讯混元曾联合清华、港科大推出图生视频大模型“Follow Your Click”;阿里智能计算研究所也推出过EMO,也仅支持用照片和音频生成唱歌视频。那么,作为国内第一批宣称拥有60秒AI视频生...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
2023中国国际飞行器设计挑战赛总决赛大放异彩
...科技创新评比项目。科技创新评比评委阵容强大,有来自清华大学、北京航空航天大学、西北工业大学等全国11所著名高校和科研院所的18位航空航天领域专家保驾护航。 “赛事以体育竞赛为平台, 推进科教兴国和人才强国战略...……更多
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件,有网友预计可能还会同时发布一个Llama 3.1-70B版本,因为“(模型提前泄露)是META的老传统了,去年的Llama模...……更多
谷歌 AI 推出 CardBench 评估框架
...用的基数估计技术,依赖于启发式(Heuristic)方法和简化模型,例如假设数据统一和列独立。这些方法虽然计算效率高,但往往需要准确预测基数,在涉及多个表和过滤器的复杂查询中表现尤为明显。最新的数据驱动方法试图在...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
5月以来,国内大模型打响了“价格战”。从每百万个Token只要1块钱,到只要8毛钱、5毛钱……国内大厂如字节跳动、百度、智谱AI、科大讯飞等不断接力,有厂商甚至直接打出了“免费”的口号,震惊整个科技圈子。实际上,硅...……更多
...水电大模型研发及其应用项目技术方案专家论证评审会在清华大学召开。由清华大学水利系牵头,联合清华大学计算机系、清华大学地学系、国能数智科技大数据服务有限公司、北京智谱华章科技有限公司组建了跨学科研究团队...……更多
...元(约合人民币180亿元)。除了创始人的身份外,他还是清华大学助理教授,2019年度北京智源青年科学家,上海期智研究院PI。本科毕业于清华大学计算机系,博士毕业于卡内基梅隆大学计算机学院。2022年4月28日,杨植麟入选AI...……更多
更多关于科技的资讯:
画里有话|充电宝容量岂能“充水”
今年8月,消费者王先生在淘宝某品牌官方旗舰店购买了一款电芯容量为10000毫安的充电宝,背面小字标示的额定容量仅有6000毫安
2025-10-23 08:37:00
厦门网讯(厦门日报记者 杨霞瑜)“AI凑单比价”“AI万能搜”“AI帮我挑”……今年“双11”大促已经开始,AI在电商平台中被广泛使用
2025-10-23 08:42:00
荣耀与比亚迪达成深度战略合作 共绘智慧出行\
10月21日,荣耀与比亚迪在深圳签署战略合作协议。双方将依托荣耀车联解决方案与比亚迪 DiLink的全新一代智慧生态,以"人"为核心
2025-10-23 08:46:00
Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴,以创新和品质突破行业边界
10月16日,创新工具品牌Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴。此次合作基于双方理念的高度契合,Fanttik以“高性能
2025-10-23 09:16:00
宁波银行南京分行携手高德地图共筑南京餐饮数字化增长新生态
10月22日,高德到店助力餐饮行业经营发展(南京专场)活动在南京圆满落幕。该活动由宁波银行南京分行与高德地图联合主办,吸引众多餐饮企业家代表参与
2025-10-23 09:44:00
近年来,民生银行石家庄分行坚持“以客户为中心”的服务理念,将支付业务作为全行战略性基础业务之一,紧跟市场发展趋势和客户需求
2025-10-23 10:02:00
沐曦发布首款全国产通用GPU芯片“中国芯”,浦口造□南京日报/紫金山新闻记者肖凡 通讯员吴晓倩IP设计、晶圆制造、封装测试全流程国内生产
2025-10-23 07:46:00
10月22日从中北大学获悉,第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛日前在全国各地拉开帷幕
2025-10-23 07:49:00
聚焦雄安新区|首颗“雄安造”卫星完成生产下线
雄安新区空天信息产业从布局迈向实质性产出阶段首颗“雄安造”卫星完成生产下线河北日报讯(记者解丽达、曹铮 见习记者李畅)10月22日
2025-10-23 07:55:00
10月22日,安平国际会展中心。当天开幕的第25届中国·安平国际丝网博览会,用满场的“智造”活力,改写着人们对丝网的老印象
2025-10-23 07:59:00
试水市场化,VR博览会迸发新活力
会展作为经济发展的“晴雨表”和“风向标”,不仅是经济发展的助推器,更是展示经济活力的重要窗口。如今,世界VR产业大会成为南昌乃至江西的一张名片
2025-10-23 06:29:00
AI赋能医院病案内涵质量提升
鲁网10月22日讯(记者 魏萱)为深入推进健康中国建设,进一步深化医药卫生体制改革,全面提升医疗质量安全水平,建设有特色的医疗质量管理体系
2025-10-22 14:27:00
胡海建眼中的“末端决胜论”,跨越速运陆运体系如何做到“快、准、稳”?
在跨越速运的“陆空协同”运力体系中,陆运网络是连接航空枢纽与客户的关键环节。董事长胡海建深知,末端服务的“最后一公里”直接影响客户体验
2025-10-22 14:37:00
布蕾克咖啡携\
近日,布蕾克咖啡携新品「云南有机瑰夏礼盒」等多款咖啡产品登陆高端超市品牌Ole'精品超市,通过优质渠道将高品质咖啡呈现给广大咖啡爱好者
2025-10-22 14:37:00
AI驱动 数据赋能丨浪潮云领跑中国城市可信数据空间市场
近日,艾瑞咨询正式发布《2025年中国城市可信数据空间行业研究报告》,从城市可信数据空间的发展驱动因素和核心价值出发,对其总体架构
2025-10-22 17:06:00