• 我的订阅
  • 头条热搜
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...者,该项目负责开发用于 AI 编程的 StarCoder 系列大型语言模型。论文标题:Planning In Natural Language Improves LLM Search For Code Generation 论文地址:https://arxiv……更多
指数反弹了,为何半数指增产品年内跑输基准?
...现分化。在市场出现较大变化时,基金经理需要调整量化模型中的因子权重和组合管理参数,以追求可持续的超额收益。这种调整可能不会立即见效,导致短期内跑输基准指数。他进一步表示,指增跑输基准指数或许和基金规模...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...满。不知疲倦一天24小时在线水贴,内容多是OpenAI下一代模型爆料消息,时准时不准……自从OpenAI奥特曼和草莓哥配合互(炒)动(作)过之后,不管你愿意不愿意看,推荐算法都会确保ta出现在你的时间线上。昨天,草莓哥声...……更多
无视安全的公司,离掉队不远了
...已成为整个AI圈儿的“Job Zero”一个最显著的问题是,大模型把纯粹的程序逻辑变成了某种黑盒,这是一个自机器学习技术遗留下来的老问题,叫做AI的可解释性——即便是模型的构建和训练者,也无法完全确认,AI 的每一次结果...……更多
...中国科学院院士、清华大学人工智能研究院院长张钹:大模型为建立通用人工智能理论提供可能性·GPT-4只能和数字世界打交道,我们最终必须跟物理世界打交道,这就需要机器人,也就是具身智能。·全世界对大模型强大的生成...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
让大模型能快速、准确、高效地吸收新知识!被EMNLP 2024收录的一项新研究,提出了一种检索增强的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需...……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...,一大波测评刷屏全网。更惊喜的是,苹果AI背后的基础模型47页技术报告,也一并上线了。一大早,人们期待已久的「苹果AI」首个预览版,正式向开发者们推送了!iOS 18.1、iPadOS 18.1、macOS Sequoia 15.1三大系统中,全都植入了苹...……更多
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...CNMO新闻】近日,谷歌发布了其首个重要的开源大型语言模型Gemma,这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来,在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的,旨在为开发人员和研究者提...……更多
ai绘画侵权实锤,扩散模型可能记住你的照片
AI绘画侵权,实锤了!最新研究表明,扩散模型会牢牢记住训练集中的样本,并在生成时“依葫芦画瓢”。也就是说,像StableDiffusion生成的AI画作里,每一笔背后都可能隐藏着一次侵权事件。不仅如此,经过研究对比,扩散模型...……更多
2024国际AI与高性能计算学术会议在合肥举行
...安全和个人安全的潜在担忧。私有化部署垂类大型预训练模型,例如GPT和BERT,通过在企业自有的硬件或私有云上实施,增强了数据的安全性和企业的自主控制力。然而,即便如此,安全风险依然不容忽视。会上,中国工程院院...……更多
大模型如同现代冶炼厂,如何利用好数据要素造“钢铁”?
...自:中国新闻网中新网5月19日电(中新财经记者 吴涛)“大模型如同现代冶炼厂,正在铸造出这个时代的‘钢铁’。”在18日举行的第六届C3安全大会上,亚信联合创始人田溯宁指出,数据正在成为最重要的资产,通感一体网络将...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链(Chain-of-Thought)等...……更多
...篡改)的“异常检测、审计和确权”;利用人工智能训练模型对攻击进行识别,以应对高级持续性威胁攻击(APT)的“学习建模”。此外,“三道防线”上,还按照不同功能,分别部署19款公共安全和网络安全防护设备。“相当...……更多
社科院团队发布安全科技价值报告:人工智能和安全科技是未来两大通用技术
...公共品,与人工智能并列为未来的两项通用技术。在AI大模型及深度数字化趋势下,安全科技的价值在放大。据了解,研究团队基于2023年全球数字社会的安全风险新形势和科技创新内在的逻辑,将安全技术作为独立技术集群进行...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多次失手,OpenAI 异军突起,硅...……更多
李飞飞最新报告:美去年AI领域私人投资是中国近9倍,中国仍是美最大竞争对手
...工智能前沿研究。2023年,产业界产生了51个著名机器学习模型,而学术界只贡献了15个。产学合作共产生了21个著名模型,创下新高。2023年,有更多数量的基础模型及开源模型问世。据统计,2023年有149款基础模型发布,是2022年...……更多
富国基金旗下富国长期成长掌舵人谢家乐的投资之旅
...端、花哨的概念,其实它的分析体系都脱胎于“波特五力模型”,也就是上游供应商、下游的购买者,现有竞争者、潜在的竞争者以及替代品。8、大家基于“波特五力模型”五大要素的叙事,衍生出了特别多的新的概念。比如...……更多
字节跳动实习生投毒自家大模型:全删了
10月19日,字节跳动大模型训练遭实习生攻击一事引发广泛关注。据多位知情人士透露,字节跳动某技术团队在今年6月遭遇了一起内部技术袭击事件,一名实习生因对团队资源分配不满,使用攻击代码破坏了团队的模型训练任务...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
...人们关于人工智能的热议,再度刷新了人们对人工智能大模型成长速度的认知。以ChatGPT、Sora为代表的人工智能大模型,为千行百业提高生产力提供了智能化工具的同时,也刷新了人们对数字安全的认识。“当前,利用人工智能...……更多
“牵手”氮元素,中非学者共赴可持续研究之旅
...了覆盖多个学科和领域的国际合作网络。“我们可以通过模型模拟、空间统计和经济计量分析、环境效应评估等多学科交叉研究手段,为不同地区的氮素管理和可持续发展提供新工具、新方法。”谷保静说。他进一步介绍说,模...……更多
科学家打造基于量子芯片的神经储存器,有望用于自然语言处理任务
...子尺度核聚变,会产生纳米电路。下一步是开发一个理论模型,以支持这样一种假设:一个物理储层能够支持源自非晶薄膜量子尺度成核的纳米电路通信。于是,他们决定利用这一特性来开发安全的基础设备,并投入资源进行该...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
无需训练即可大幅提升SAM 2!SAM2Long来了,港中文 上海AI Lab出品
...出了创新的记忆结构设计,打造了专为复杂长视频的分割模型。论文链接:https://mark12ding.github.io/project/SAM2Long/asset/images/paper.pdf 项目链接:https://mark12ding.github……更多
...,如何让数据要素更好赋能新质生产力发展,以及,AI大模型时代,网安行业如何为“新质生产力”保驾护航?在峰会期间,奇安信集团董事长齐向东接受了《科创板日报》记者的采访。**网安能力是数字政务、智能制造等新场...……更多
...融网络安全应用场景。数字中国研究院(福建)发布《大模型训练数据白皮书》《交通数据要素×行业服务白皮书》《高校数字化转型数据要素应用白皮书》。报告指出,目前我国已有208个省和城市上线数据开放平台,共开放20...……更多
史上最高金额!亚马逊向OpenAI劲敌追投27.5亿美元,估值184亿美元
...的AI初创企业展开合作,为后者提供算力和资金以开发新模型和应用程序。而由于像ChatGPT和Claude这样的大语言模型需要极高的构建和训练成本支撑,AI初创企业获得的大部分资金也都被用于云计算。作为战略合作的一部分,亚马...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
更多关于科技的资讯:
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00
近期,光交换机行业催化剂不断。在中国国际光电博览会,OCS(光电路交换机)作为下一代交换技术的主流方向之一被重点展示。业内人士指出
2025-09-24 09:54:00
平安产险镇江中支助力“苏超”焦点战 贴心服务点亮球迷体验
9月20日,在“苏超”镇江队与无锡队激烈对决的赛场内外,平安产险镇江中支开展了系列品牌推广与球迷服务活动,不仅为现场近三万观众送去清凉与惊喜
2025-09-24 10:55:00
10大AI场景亮相!三翼鸟把“人工智能+”装进3000m²家
当前,人工智能正以前所未有的深度与广度融入千行百业。智能家居行业也迎来关键转折——从单点智能走向全屋智慧,从“人控制设备”升级为“家主动为人服务”
2025-09-24 10:59:00
海尔“懒人洗衣机”获近百万台海外订单
9月19日,海尔第九届人单合一模式引领论坛在北京举行。会上,海尔智家董事长兼总裁李华刚分享了海尔智慧家庭智能交互引擎的实践成果
2025-09-24 10:59:00
中移齐鲁创新院:九大成果入选“鼎新杯”典型案例
近日,2025数字化转型发展大会在北京举行。在大会应用征集评选活动中,中移齐鲁创新院共9项成果入选第四届“鼎新杯”数字化转型典型案例
2025-09-24 11:00:00
海尔泰国空调生产基地应用“无人物流+数字孪生”
在数字经济与实体经济深度融合的浪潮下,海尔智家再次以“数字化转型”的创新实践站上全球舞台。9月23日,海尔智家位于泰国春武里的空调生产基地正式投产
2025-09-24 11:00:00
以大模型重构记录边界,讯飞AI录音笔让每一段声音都被理解
近日,《关于深入实施“人工智能+”行动的意见》(下称《意见》)正式发布,明确提出到2027年,实现人工智能与6大重点领域广泛深度融合
2025-09-24 11:22:00
京东超市宣布:三年内扶持100家个护行业新锐品牌 每年打造百款爆品和百大商家店铺
9月23日,2025京东超市个护行业发展大会在北京举行,全国近400家知名个护品牌高管参会,共同探讨行业新趋势、新机遇
2025-09-24 11:37:00
中新经纬9月24日电 据路透社报道,因网络攻击,英国最大的汽车制造商捷豹路虎(Jaguar Land Rover)将停产期限延长至10月1日
2025-09-24 11:42:00
麻六记再因酸辣粉发霉引热议,北京麻六记房山分店已注销
近日,因有网友发视频称麻六记酸辣粉连续开了四盒都发霉一事引发热议。据悉,此次并非麻六记第一次被曝出酸辣粉发霉。今年7月份
2025-09-24 11:43:00
盈美信科炫动2025太原马拉松,金融科技赋能赛事生态
9月21日清晨, 2025太原马拉松赛在五一广场鸣枪开跑,4万名跑者踏响“千年晋韵、锦绣太原”的赛道,在汾河之畔展开活力角逐
2025-09-24 11:46:00