• 我的订阅
  • 头条热搜
一行代码训练成本再降30%,AI大模型混合精度训练再升级
...独特的数值表示方式,能够在保持一定精度的同时,在大模型训练中提高训练速度、节省内存占用,最终降低训练成本。AI大模型开发系统Colossal-AI的混合精度训练再度升级,支持主流的BF16(O2) + FP8(O1)的新一代混合精度训练方案...……更多
港媒:中国科学家开发出AI模型或可预测全球洪水
...5月11日报道,中国科学家开发了一种新的人工智能(AI)模型,可以预测世界各地的洪水风险和跨区域流量,甚至可以对缺乏水文记录的流域进行预测。该模型名为ED-DLSTM,不同于其他预测模型依赖历史流量数据,它使用海拔和...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
为满足大模型的“暴力”计算需求,国内GPU企业正加码算力基础设施建设。12月19日,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍,这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
...议。5月28日,DeepSeek 在官方微信群发布消息称,DeepSeek R1模型已完成“小版本试升级”,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。不过,澎湃新闻记者查询官方网站等,发现没有对此...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...研究中心主任曾毅等多位嘉宾,分别从 AI 数据、算力、模型与框架、应用、产品、治理、未来目标等多个方面分享前沿进展。钛媒体App简要梳理了各个嘉宾的演讲和圆桌的部分内容,以飨读者。5年投资超1000亿、最高重奖1亿元...……更多
中国石油发布700亿参数昆仑大模型建设成果
...月28日,以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办,标志着中国石油在人工智能领域又迈出坚实一步。发布会上,中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商和情商水平。(全球大语言模型(LLM)情商...……更多
定价15000!老黄重磅发布RTX 5090:世界最小AI超级计算机也来了
...I超级计算机——Project Digits。有多强悍? 2000亿参数的大模型,直接在你办公桌上(自己的桌面系统)就能跑!如果把两台Project Digits一块“食用”,那么还可以跑4050亿参数的大模型。据了解,每个Project DIGITS配备了128GB统一、...……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
...迹来自云计算内部使用,但2022年谷歌称60%的能耗与语言模型有关。环境战略咨询公司iCare by BearingPoint高管利奥·热南认为:“AI企业应更透明,也应找出一些共同的新方法评估推理带来的影响。”目前,大学科研人员和企业在尝...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
【新智元导读】UrbanGPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等...……更多
大模型密集落地医疗生态,壹生检康推出中西医妇科“智能体”应用“闺蜜AI医生”丨创新场景
医疗健康领域正成为大模型厂商们争相入局之地。日前,OpenAI创始人兼CEO萨姆・阿尔特曼(Sam Altman)参与创办了一家名为Thrive AI Health的公司,旨在利用人工智能技术帮助人们养成更健康的生活方式。在国内,医疗大模型正在to ...……更多
苹果的人工智能为何与众不同?高管这样说
...大超级计算机,以开发更为复杂且耗电量更高的人工智能模型。而用户通常需要通过互联网与同样强大的服务器进行交互,才能访问这些人工智能软件。苹果对人工智能的愿景并非局限于构建庞大的模型,而是聚焦于一系列轻量...……更多
山东移动:坚持科创引领,乘“数”而上焕新能
...产力,聚焦海洋、医药、文旅、化工等特色产业,推动大模型、大数据成果应用快速落地,以要素整合、研发创造、成果转化为重点,赋能数字政府、智能制造创新转型。发布“观海”海洋科学智算,为海洋科研提供高效支持。...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
DPVR闪耀2025 AI眼镜产业大会
...,2024年全球AI终端设备市场规模突破2000亿美元,搭载大模型的AI眼镜作为未来智能穿戴设备的重要形态,不仅承载着人机交互模式的革新,更能深度融入生活场景,商业潜力巨大。市场预测,智能眼镜市场在未来几年将保持高速...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...2月19日,观察者网了解到,摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办,这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。与此同时,摩尔线程联合国内众多合作...……更多
...绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。自亮相以来,腾讯混元大模型持续迭代升...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...流配送等关键领域具有重要意义。然而,现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题,限制了模型的泛化能力和实际应用范围。近日,来自于香港科技大学(广州)、南方科技大学、...……更多
百度研发出广告推荐新系统:大模型加持、转化率提升3.6%
...介绍了一种名为COBRA的新算法框架,被应用于提升生成式模型在广告推荐系统中的使用效果。根据论文介绍,工程师将COBRA框架应用于真实环境中的A/B测试,结果显示转化率提升了3.6%,平均每用户收入(ARPU)增加了4.15%。目前,...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
【新智元导读】代码模型可以自己进化,利用自身生成的数据来进行指令调优,效果超越GPT-4o直接蒸馏!LLM作为智能的基座,可以衍生出各种能力。代码能力就是其中一种:程序补全、注释、优化、修bug、测试等等。而想要充...……更多
...行。“赋能”可以说是本届大会的关键词,大会关注AI大模型、产业数字化等数字经济发展前沿话题,设立多类展馆展出前沿技术、应用实例和解决方案。作为今年最受瞩目的新技术,人工智能技术发展已驶上快车道,全国各地...……更多
摩尔线程kuae千卡集群正式落地
12月19日消息,摩尔线程今日宣布,首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地,大模型智算加速卡MTTS4000也同步发布。...……更多
蜘蛛侠妖娆起舞,下代ControlNet来了!贾佳亚团队推出,即插即用
...样的可控生成!而且SDXL、SD1.5等Stable Diffusion家族的常见模型都能适配,还是即插即用。同时还能搭配SVD控制视频生成,动作细节控制得精准到手指。在这些图像和视频的背后,就是港中文贾佳亚团队推出的开源图像/视频生成引...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
一夜之间,名为“red_panda”(小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like...……更多
大模型时代的阿里云,将云计算进行到底
文|葛覃大模型与云计算,正在成为新时代的淘金者和卖铲人。自ChatGPT刷屏之后的数月时间,微软Azure与OpenAI的示范效应传导至全球,基本所有能做大模型的厂商都尝试“淘金”,其中,云厂商是一股重要力量,云计算天然适...……更多
更多关于科技的资讯:
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00
龙岩联通“5G+AI+无人机”项目荣获第八届“绽放杯”5G应用征集大赛全国优秀奖
东南网龙岩12月5日讯(通讯员 曹可煊)近日,第八届“绽放杯”5G应用征集大赛全国赛圆满落幕。龙岩联通为华电连城风电打造的“智驭低空——构建‘5G+AI+无人机’绿电智能运维新范式”项目
2025-12-05 17:16:00