• 我的订阅
  • 头条热搜
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...用辅助信号进行更快的优化。 对 RecDiff 框架抗噪能力的进一步探索团队评估了 RecDiff 在数据噪声情况下的鲁棒性,方法是在用户-用户图中引入随机虚假边来替代不同比例的真实社交连接。然后使用被破坏的图对模型进行重新训...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...的偏好数据,无法处理更为广泛的反馈类型。此外,KTO 进一步扩展了 DPO,能够处理二元数据(如正向和负向反馈),但它同样有其局限性,无法统一处理不同类型的反馈数据,也无法有效利用已有的奖励模型。在这种背景下,...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明,大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...模型在面对复杂任务时,会显式且动态地选择元动作,再进一步展开相关动作的具体思维过程。通过这种设计,利用部分训练任务,可强化模型对关键元动作组合的使用,显著提升模型学习效率。研究团队认为,模型在思考过程...……更多
综改示范区AI团队首战电力市场
...索最优博弈策略。清鹏智能还将继续优化算法和模型,并进一步扩大AI交易系统的应用范围,在山东、山西、广东和江浙等地进行真实市场环境下的验证。 ……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...70%、80%的场景。未来,公司计划在与中长尾客户合作时,进一步增加客户需要的功能。若愚科技已经完成130亿参数的基座模型的研发,机器人大脑架构设计、产品设计研发也颇有进展,公司正在进行面向覆盖不同领域和不同形态...……更多
2023年AI的钱被谁赚走了?
自2023年初ChatGPT爆火以来,各互联网大厂、大模型初创企业,甚至千行百业都在下场做大模型,“通用大模型”“垂类大模型”“AI智能算法”等成为企业自身业务和产品的高频词。一时间,几乎无处不AI。投资机构和互联网大...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3.1 Instruct 的相应版本!长达 73 的技术报告详细介绍了后训练的细节。在...……更多
16家头部大模型公司上海神秘碰头,现场人挤人人人
挤爆了,简直要被大模型公司们给挤爆了。来感受一下这个feel:毫不夸张地说,国内外叫得上来的大模型公司基本上都来了——Anthropic、Meta、Mistral.AI、Stability.ai、月之暗面、智谱AI、百川、MiniMax……到底是什么样的事情能让...……更多
AI行业深度研究:乘大模型之风,AI芯片元老寒武纪再度起航
...式带动了加速计算的需求突破式增长,随着 Scaling law 的进一步拓展,Nvidia 数据中心的收入从 2024 财年 Q1 的 4 3 亿 美金增加至 2025 财年一季度的 226 亿美金,同期超威电脑和 DELL 的 AI 服 务器收入也大幅增加。我们预计未来针对...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...设计和运行自家定制光学系统,以持续降低故障率。为了进一步优化网络,AWS在tnp10网络中建立了一个全新的网络路由协议“可扩展意图驱动路由(CIDR)”,通过分散的速度和弹性提供了集中的计划、控制和优化。三、生成式AI...……更多
科大讯飞申请对话模型训练等专利,提升多轮对话的生成质量
...局信息显示,科大讯飞股份有限公司申请一项名为“对话模型训练方法、对话方法、系统、设备及介质”的专利,公开号 CN119862964A ,申请日期为 2025 年 3 月。专利摘要显示,本发明提供一种对话模型训练方法、对话方法、系统...……更多
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...予厚望,并且未对其生成内容范围过多限制,希望能借此进一步追赶OpenAI的领先地位。马斯克旗下人工智能初创公司xAI本次共推出两款型号的产品,包括Grok-2早期预览版及Grok-2 mini。据xAI介绍,Grok-2相较于上一代大模型Grok-1.5取...……更多
《移动通信与AI融合的数据格式和模型建议书》发布 【《移动通信与AI融合的数据格式和模型建议书》发布】财联社12月22日电,中国信息通信研究院移动通信创新中心联合华为技术有限公司、中兴通讯股份有限公司、中信科移...……更多
...达到阈值,但可能“引发风险”。此外,提案表示,需要进一步讨论来确定护栏,以确保通用目的人工智能系统和非常强大的人工智能系统都不会生成非法和有害内容。大规模通用目的人工智能和非常强大的基础模型的附加规则...……更多
火爆全球的Chat GPT,想毁灭人类?
...不感慨于科技的力量。Open AI公司官方称,相比之前的GPT模型,Chat GPT采取了全新的训练方式——“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。AI绘画作品“Théâtre D'opéra Spatial”……更多
AI领域将面临数据墙:高质量语言数据枯竭 可能减缓训练进展
...联网高质量数据枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。据权威研究公司Epoch AI的前瞻性分析,至2028年,互联网上的所有高质量文本数据或将被悉数采撷,而机器...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...已成为一个活跃且前景广阔的研究主题。以下是几个未来进一步探索和研究的方向。提高模态的数量与质量:表 3 中显示,只有少数 MMCL 方法关注视觉和语言以外的模态。因此,在整合更多模态方面还有巨大的研究空间。此外,...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的助推剂,而其中的一股重要力量就是来自MetaMeta在人工智能开源界可谓是硕果颇丰,从大模型LLama到图像分割模型Seg...……更多
2024全年盈利,AI赋能打开平安健康估值空间丨智氪
...本身又存在大量冗余和谬误,在缺乏医生校对的情况下,进一步拉大了与“平安医博通”等专业医疗大模型的差距。二、投资策略进入今年以来,由DeepSeek引发了一轮AI热潮,从底层逻辑来看,算力已经不再是我国AI大模型的最大...……更多
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
...性:“大语言模型技术几年来得到了很快发展,但不论是进一步推动当前范式下的Scaling Law,还是模型逻辑推理能力的强化,或是模型学习、记忆能力的进一步提高,仍然有非常多的工作亟待我们去深入研究。希望双方能充分发...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...及支持 100 多种语言的文本,文档和图像理解能力得到了进一步的提高。 在提高分辨率阶段,研究通过对整个模型进行微调(解冻图像编码器)并使用逐渐增加分辨率的短期课程来提高 PaLI-3 的分辨率,保持在 812×812 和 1064×1064...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。 为进一步促进社区的多模态对齐研究,日前,该团队以将「Align Anything」框架进行开源。通过该框架,研究人员不但可以利用该框架进行多模态模型的对齐实验,提高模型的...……更多
AI大模型应用商机:“AI+”还是“+AI”
...AI大模型应用向更自然的人机交互持续迈进。GPT-4o的推出进一步推动了AI应用的繁荣,以AI大模型主导的创新应用前景也有望打开新的想象空间。对不同企业来说,AI大模型应用模式主要基于“AI+”和“+AI”展开,其中“AI+”是以A...……更多
大华股份获得发明专利授权:“设备模型升级方法、装置、设备、服务器及存储介质”
...股份(002236)新获得一项发明专利授权,专利名为“设备模型升级方法、装置、设备、服务器及存储介质”,专利申请号为CN202010809190.7,授权日为2025年3月7日。专利摘要:本发明公开了一种设备模型升级方法、装置、设备、服...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...算最优模型。在后训练阶段,Meta 使用了 405B 的旗舰模型进一步提高了 70B 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个...……更多
林伟:大数据AI一体化的解读
...杂的大数据和AI交互的流程图。Serverless云原生服务如果想进一步地去把大数据和AI融合好,用户希望能够在一份资源里面提供大数据和AI的服务。这时候就离不开Serverless云原生服务技术。我们一直在说云原生,但是云原生其实是...……更多
杨仝团队发布FairyR1模型:5%参数量数学和代码能力超越满血DeepSeek
...yR1-32B。FairyR1-32B模型是在团队前期TinyR1工作基础上进行的进一步探索,沿用了“分合蒸馏”的研究思路,提出了多种改进方法,包括自我合并、多教师交叉蒸馏、轻蒸馏等方法,并在数据处理进行了优化,模型精度有了显著提升...……更多
更多关于科技的资讯:
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00
当城市核心区的物理空间增长几近饱和,未来的竞争力新高地何在?12月5日,一场发布会以别开生面的“数字气味”体验开场,为上城区加快建设中央创新区(CID)的战略发布
2025-12-07 07:21:00
日前,山西转型综改示范区入区企业山西恒真真空玻璃科技有限公司自主研发的新产品——“真空发热玻璃”上市。这一产品将高效真空玻璃技术与新型半导体制热技术深度融合
2025-12-07 07:32:00
生产设备共享给清河羊绒带来什么——河北特色产业集群共享智造故事(四)纱线在电脑横机上来回穿梭、电商平台的提示音此起彼伏……随着冬季来临
2025-12-06 08:04:00
厦门移动智慧康养产品亮相首届海峡两岸(厦门)银发博览会
市民现场体验移动随心屏(闺蜜机)的AI舌象问诊功能。厦门网讯 (文/厦门日报记者 许晓婷 王玉婷 通讯员 陈奕珣 图/厦门移动 提供)伸出舌头拍一拍
2025-12-06 08:26:00
厦门网讯 (厦门日报记者 林露虹)刷到一部微短剧,不知不觉被剧情吸引,回过神来看介绍,发现竟是AI参与制作的。类似经历
2025-12-06 08:26:00
从“手搓”到“智造” 厦门跑步机“跑”向全球
厦门网讯 (厦门日报记者 詹文 林健华)在位于同安工业集中区的生产车间里,一节一节钢板正传送上激光切割台,自动切割、打孔
2025-12-06 08:26:00
共建共享破局资源瓶颈:临沂联通与电信合作以5G RedCap创新实现业务与服务双突破
鲁网12月5日讯近日,临沂联通与临沂电信深度践行国家共建共享战略,成功完成全省首个基于电信800M频段的5G RedCap技术承载联通物联网专网业务的商用落地
2025-12-06 13:44:00
中国青年报客户端讯(中青报·中青网记者张均斌)近日,“中央引导地方”专项科技赋能文化方向立项课题——“面向文博场景的智能伴游导览系统研发及示范应用”启动会
2025-12-06 15:25:00