• 我的订阅
  • 头条热搜
meta推出全新开源大模型codellama70b
近日,Meta正式宣布推出全新开源大模型CodeLlama70B,据悉,CodeLlama70B在HumanEval基准测试中的准确率达到了53%,超过了GPT-3.5的48.1%,并且接近OpenAI的一篇论文(PDF)报告的GPT-4的67%,是目前评分最高的开源大模型。据CNMO了解,Cod……更多
华为大模型演示系人为操控?昇腾社区:均为真实代码,非调取...
...完成RAG应用开发。现场图片为实时生成,调用的是开源大模型。代码中有time.sleep(6)等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造更高效释放场景能力的智能办公平台。最强理科能力!商汤“日...……更多
代表好声音 | 娄超:全面推动大模型应用 让数字重庆更智能
...全面深化改革纵深发展”时,他备受鼓舞。“通用认知大模型的发展已经是国内国际科技竞争的制高点,也是全球数字经济发展引擎,而重庆在这方面已经具备了很好的发展基础。”娄超建议,将大模型技术纳入数字重庆“1361...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...定义图像识别系统,能够通过迁移学习技术,将已训练的模型应用到新的模型训练中,以较少的数据量训练出高效的机器学习模型。微软也推出了基于私有数据的Azure OpenAI 功能,它技术借助算法让电脑对大量流动数据集进行识...……更多
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10
...g Window Attention)。由此以来,模型在保证处理长序列数据高性能表现的同时,还能大大降低推理成本。Yi-Lightning还引入了跨层注意力(Cross-Layer Attention, CLA),允许模型在不同的层次之间共享键(Key)和值(Value)头,减少对存...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
智东西6月3日消息,大模型“套壳”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
...策略支持动态分辨率图像,语言部分采用 MoE 架构低成本高性能训练:继承 DeepSeek-VL 的三阶段训练流程,同时通过负载均衡适配图像切片数量不定的困难,对图像和文本数据使用不同流水并行策略,对 MoE 语言模型引入专家并行...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
揭开大模型“混元”的面纱两个月后,10月26日,腾讯混元迎来第一次“批量上新”,并且对外开放。首先,通过测试申请的用户,都能够在“混元”上画画了——从生成图像的准确度、美观度而言,如今混元搭载的“灵感”模...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
... 20 年来上限规模最大增幅。此外,FunSearch 的性能还优于最先进的计算求解器。此外,研究人员还将 FunSearch 应用于计算机科学中的实际挑战来探索 FunSearch 的灵活性。“装箱”问题着眼于如何将不同尺寸的物品装入最少数量的箱...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...了Andromeda集群,是当今吞吐量最高的GPU集群之一,部署了最先进的H100 GPU和Quantum-2 InfiniBand网络。网页来源:https://andromeda.ai/他们表示「相信ESM3的计算总量是有史以来生物模型之最」。推理蛋白质的序列、结构和功能处理文本的...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...需要做的,只是输入包含几句话的提示词。数秒钟后,大模型就生成了代码,还列出了环境需求,复制完代码就可以使用了。这不是程序员父亲带自家小孩做的网红项目,而是人人都可以尝试的事。在大模型的帮助下,代码正在...……更多
2023 re:Invent——从云计算到AI未来的一场全面重塑之旅
...多数据库引擎和部署方式。Amazon OpenSearch Serverless则提供高性能的向量存储和搜索功能。此外,Amazon DocumentDB和Amazon DynamoDB新增向量搜索功能,而Amazon MemoryDB for Redis的向量检索功能也已发布预览版。为充分发……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...单。当然,其中一部分取得融资的公司采用的的确是时下最先锋的 GA 模型,比如种子轮获得 1.01 亿美元的 StabilityAI,但很多获得融资的公司,也不过是用以往的 AI 模型蹭上了热度而已。这加大了投资人和机构的判断难度,自然...……更多
英伟达SC24六大技术亮点,不止加速超算500强
...研发展。持续加速最前沿科研和行业应用,让英伟达保持高性能计算领域的绝对王者 。加速前沿科研的新选择发布cuPyNumeric,“无痛”加速科研科学研究需要对大量数据进行处理分析,处理数据的速度越快,科学家们就能越快地...……更多
华为云研发大模型公测开启智能开发新篇章
...CNMO注意到,据华为云中国区官方微信号消息,其研发大模型CodeArtsSnap已于12月28日正式开启公测。这一创新性工具旨在提升软件开发效率,引领智能开发领域的新篇章。CodeArtsSnap基于华为云研发大模型开发,是一款覆盖软件开发...……更多
让AI管理大型代码库,开发者福音 | 阿里/新加坡国立/西安交大
代码生成和补全任务做不完了?!不如试试让大语言模型(Large Language Models, LLMs)来帮忙。不过,如果是处理大规模、多文件的代码库,LLMs就可能犯了难。这时候,往往需要需要Retrieval-Augmented Code Generation(RACG)系统来检索相...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
美国斯坦福大学的一个AI(人工智能)团队就抄袭中国大模型致歉。近日,由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V。但是,该模型很快被曝出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...地与环境和自身频繁交互,并从中获取经验予以改进。大模型自我进化研究之所以重要,正是源于该思想,并且更倾向于探究大模型自身能力的深度挖掘和扩展。基于这一趋势,北京理工大学 DIRECT LAB 正式启动了「大模型自我进...……更多
云联盟“首届AIGC全网小程序应用创新大会圆满召开
...就是要应用到算力。天翼云可以通过提供智算算力(包括高性能计算,存储和网络)、国云大模型生态、模型开发平台等一些列一站式服务,更好的助力千行百业数智化升级及AI创新应用。天翼云AI智算产品线总监关越 百度智能...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...,OpenAI CEO 山姆・奥特曼向我们介绍了迄今为止最强的大模型,和基于它的一系列应用,一切似乎就像当初 ChatGPT 一样令人震撼。OpenAI 在本周一的首个开发者日上推出了 GPT-4 Turbo,新的大模型更聪明,文本处理上限更高,价格也...……更多
前谷歌工程师创业造AI芯片!产品明年问世,已拿到1.8亿融资
...资上。如果情况不改变,他们就会没钱。这些AI企业需要高性能AI芯片不断提升大模型的算力。MatX认为,如果能得到这些AI企业的支持,为他们提供性能更好的AI芯片,该公司的业务将得到较大发展。▲Reiner Pope(左)和Mike Gunter...……更多
大模型全方位重构云计算,2024年或将成为AI原生应用元年
...北京举办。百度智能云公布了最新成果。自8月31日文心大模型向全社会全面开放以来,在千帆大模型平台上,大模型API日调用量增长10倍。目前千帆平台已经累计服务超过4万家企业用户,累计帮助企业用户精调近1万个大模型。...……更多
前实习生篡改代码攻击大模型训练 字节跳动起诉要求赔偿800万元
...洋)字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案,已获北京市海淀区人民法院正式受理。字节跳动请求法院,判令田柯宇赔偿公司侵权损失800万元及合理支出2万元,并公开赔礼道歉。11月5日,字节跳动曾...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...上层应用的完整自主技术。算力上,腾讯拥有自研的星脉高性能计算网络,可为AI大模型带来10倍通信性能提升;训练和推理框架上,腾讯自研的机器学习平台训练速度是主流框架的2.6倍,大模型推理成本相比业界主流框架下降70...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00