• 我的订阅
  • 头条热搜
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...人都被这样一条消息惊掉下巴:「字节跳动大模型训练被北大实习生攻击,损失巨大」。什么仇什么怨,要做这样的事?网友们扒出来,事情起因是这位北大高材生在字节实习期间对团队感到不满,一气之下选择了「投毒」。具...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...面实现了改进,成为了首个将生成和判别任务统一在同一框架内的条件生成模型。这意味着,BiGR 不仅是一个好的图像生成器,同时还是一个强大的特征提取器,二者是相互促进的关系。 论文标题:BiGR: Harnessing Binary Latent Codes f...……更多
...,实现以前无法达到的定制化水平和真实度。当然,风险偏好各不相同。对于像魔爪能量(Monster Energy)饮料这样的前卫品牌奏效的营销方法可能并不适合保守的机构。但即使在高度规范和保守的环境中,企业也有可能以限制风...……更多
大厂加码落地大模型,京东云一口气发了10个AI应用
...性的个人助手和更加专属的大模型驱动的工具,例如 AI 代码生成、AI 营销等。未来大模型的商业模式或将更加多元化,并与各行各业深度融合,满足人们的基本需求。从京东云的动作可以看出,拥有场景的大公司相比很多创业...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...为「Prover-Verifier Games(证明者 - 验证者博弈)」的博弈论框架。该框架由两个相互竞争的学习者组成:一个可信的验证者(Verifier)网络试图选择正确的答案,另一个更强大但不可信的证明者(Prover)网络试图说服验证者接受特...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...散模型和大模型对齐。OpenAI 最近发布的 o1 模型在数学、代码生成和长程规划等复杂任务上取得了突破性进展,据业内人士分析披露,其关键技术在于基于强化学习的搜索与学习机制。通过迭代式的自举过程,o1 基于现有大语言...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...lama原生支持的JAX、PyTorch和TensorFlow,使其能够轻松与用户偏好的工具和工作流程结合。此外,Gemma已通过NVIDIA TensorRT-LLM优化,可以在NVIDIA加速的基础设施上运行,或作为NVIDIA NIM推理微服务运行,未来还将优化NVIDIA的NeMo,并……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数量大10倍的CodeLlama-70B-Instruct。在全部的三项基准测试(代码生成、数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turb……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...能?”RoboMamba 方法2. RoboMamba 模型结构图 3. Robomamba 整体框架。RoboMamba 通过视觉编码器和投影层将图像投影到 Mamba 的语言嵌入空间,然后与文本 tokens 连接,并输入到 Mamba 模型中。为了预测末端执行器的位置和方向,我们引入简.……更多
昇思MindSpore 2.3全新发布
【TechWeb】3月22日消息,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...文中,研究人员结合渐进式蒸馏、监督微调(SFT)和定向偏好优化(DPO)等方法达成了这一目标。光是变大还不够,在性能匹配Transformer的前提下,速度也要够快才行。 Mamba凭借固定的推理开销,在长序列中的优势明显,但Transf...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...推理能力。作者表示,他们期待探究更通用化的自我进化框架和方法,使其在各种场景中都可以被广泛使用。流星雨计划论文:https://arxiv.org/abs/2411.11933 Github 链接:https://github.com/DIRECT-BIT/METEOR该计划提出一个由弱到强的……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...卡罗树搜索(MCTS)与自我批评机制相结合,并使用直接偏好优化(DPO)算法的 off-policy 变体对 agent 的交互进行迭代微调。这种方法允许 LLM agent 同时从成功和不成功的轨迹中进行有效学习,从而提高在复杂的多步骤推理任务中...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...统工具和180+三方工具的调用,以及全面升级了大模型的代码生成能力,能实现数理计算和Excel的数据分析能力。 2、重磅推出3B端侧大模型:带来手机终端黄金尺寸3B端侧大模型,在模型能力领跑行业5B以下模型,在写作对话、摘...……更多
阿里AI新技术,让普通人秒变舞蹈达人
...也能轻松创作出多样化的动漫角色。用户可以根据自己的偏好,自由搭配角色的面部、服装、配饰和背景,创造出具有个性和魅力的二次元角色。 以及,随着数字人技术的发展和成本的降低,Animate Anyone技术也在虚拟数字人的...……更多
突破次元壁!新加坡国立发布GenXD:拿捏真实感3D、4D动态场景
...新加坡国立大学(NUS)的研究人员提出了一种全新的生成框架——GenXD,不但能生成极具真实感的3D场景,还实现了从相机视角和物体图片中「生长」出逼真的4D动态场景。项目主页: https://gen-x-d.github.io/论文链接: https://arxiv.org...……更多
生成式AI时代的业务流程管理变革,BPM迎来大型流程模型
...更管理。当然,其中的大部分挑战都可以通过战略规划及框架、技术补齐来克服。从FM到LLM2021年,斯坦福大学的研究人员首次提到了基础模型(FM,Foundation Models),以总结机器学习模型的新水平,与迁移学习的概念密切相关。...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...数据2.0秘诀曝光了!来自微软的研究人员们提出了智能体框架AgentInstruct,能够自动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这...……更多
阿里巴巴推出atomovideo高保真图生视频框架
...队近日推出了AtomoVideo高保真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下:高保真度:生成的视频与输入图像在...……更多
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
...部日前,旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架,用户只需输入一张静态的肖像图片,以及一段视频(演讲、表情包、rap)文件,即可生成一段表情丰富、动作一致的 AI 人像视频。MegActor 所...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...卖等复杂多步骤任务中,能够自动为用户推荐满足其座位偏好、餐食选择偏好的决策。真正做到让大模型适应每个用户独特需求和偏好做到千人千面。(2)代码解释功能上线——该功能可以在安全的沙盒环境中动态生成和运行...……更多
Github Copilot 初体验
...已经有实验证明 GPT-3 可用于撰写文章、回答问题、编写代码生成应用程序、设计表格、开发游戏、将文字描述便携为成型的网页等等。而 OpenAI Codex 则是基于 GPT-3 开发的一款针对编程所设计的 AI 模型。Codex 从公共代码仓库学习...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...已经接近 30%。与此同时,随着通义大模型在语义理解、代码生成、开发工作流等方面全面进化,通义灵码的能力也在全面提升。较之通义灵码 AI 编码助手,最新升级的 AI 程序员同时具备了架构师、开发工程师、测试工程师等多...……更多
百川智能发布baichuan3稳定语言模型
...al和MBPP中同样表现出色,证明了Baichuan3在自然语言处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳...……更多
AIGC风潮席卷手机:但在PC面前 还是个弟弟
...故事创作、生成大纲、信息提取、美食指南、旅游规划、代码生成等等。除了基于大语言模型的工作和生活助手,AIGC最常使用的另一个场景就是StableDiffusion文生图、文胜文,这一点如今无论手机还是PC都可以做到。 当然,还是...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...可学习样本的新颖优化过程。它扩展了误差最小化(EM)框架,以优化图像噪声和额外的文本触发器,从而扩大了优化空间,并有效地误导模型学习噪声特征和文本触发器之间的捷径。 论文链接: https://arxiv.org/abs/2407.16307代码链...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...出了自学评估器(Self-Taught Evaluator),可以用于生成合成偏好数据以训练奖励模型,而无需依赖人工标注。这种方法生成对比的模型输出,并训练一个作为评委的大型语言模型(LLM-as-a-Judge)以生成用于评估和最终判断的推理痕...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...这种方法称为「Best-of-N」采样。实验中使用了OpenAI的3个代码生成模型,并通过循环机制(round-robin)让FLAMe分别对它们生成的10个代码样本进行重新排名,然后使用排名靠前的代码示例,在HumanEval Python基准中测试其性能。 结果...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...背景下的含义」。不仅如此,为了更清楚地洞见编程逻辑框架、项目管理全流程,文心快码还能通过流程图的方式,直观地展示完整的调用逻辑。 其次代码质量也是架构师关注的关键领域,而单元测试(UT)则是保障代码质量...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00