• 我的订阅
  • 头条热搜
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
...提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人的人工智能系统铺平了道路。近年...……更多
重复造轮子的百模大战:两极热 中间空
...粟“不敢下手,现在中国还没跑出来一家绝对有优势的大模型,上层应用没法投,担心押错宝。”投资人Jucy(化名)向光锥智能表示,AI项目看得多、投的少是这段时间的VC常态。ChatGPT点燃AI大爆炸2个月中,中国一直在等待自己...……更多
关于AI新浪潮:被仰望的与被遗忘的 | Waves新浪潮大会
...。首先请各位老师介绍下自己,以及所在平台正在做的大模型相关的一些情况。戴雨森:真格基金是中国领先的天使投资基金,其实在过去十几年我们投资了很多AI相关的项目,在大模型浪潮开始之后,我们发现,很多过去投资...……更多
Yann LeCun朝“世界模型”理论迈一步,Meta开源“像人一样学习”的图像模型 | 最前线
...得者Yann LeCun共同提出——I-JEPA也被视作继LeCun提出“世界模型(World Model)”构想后,第一个卓有成效的进展。从自回归到世界模型为何图像生成模型普遍难以精确生成手部?其根本原因在于以自回归为框架的模型缺乏对现实世...……更多
“百模大战”,国产 GPT 大全
...天机器人。经过大致统计,目前主要有22家公司开发的大模型相对成熟,从应用方向来看,主要分为“通用型”和“专业型”。通用型文心一言Baidu 旗下的“文心一言”是基于飞桨深度学习平台和文心知识增强大模型。能够与人...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
北京占大模型“半壁江山” 算力支持政策酝酿出台
...域顶级专家学者和企业、机构代表围绕当下最具热度的大模型发展话题分享了深刻洞见和思考。全国首个政务服务需求应用场景、北京市首批人工智能大模型高质量数据集、近百个场景案例发布,十个合作项目集中签约,展现出...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
大模型加持!理想任务大师2.0全面整合理想同学能力
...全新OTA 6.4.0版本软件更新正式开始推送。此次更新在AI大模型的支持下,对理想汽车的“任务大师”功能进行了全面整合和升级。首先,更新增加了更多任务条件和执行动作的能力。用户现在可以自定义“理想同学-理想同学语音...……更多
千行百业加速拥抱大模型(AI前沿观察)
...术创新快 应用渗透强 国际竞争激烈千行百业加速拥抱大模型(AI前沿观察)潘旭涛 陈斯达《 人民日报海外版 》( 2023年12月22日 第 08 版)在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。新华社记者 ...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...出图像目标表示(IGOR,Image-GOal Representation),“投喂”模型人类与现实世界的交互数据。IGOR能直接为人类和机器人学习一个统一的动作表示空间,实现跨任务和智能体的知识迁移以及下游任务效果的提升。要知道,在训练具身...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...创科技有限公司(以下简称“数势科技”)和国内通用大模型厂商北京百川智能科技有限公司(以下简称“百川”)联合发布大模型数据分析垂直领域应用解决方案。此联合解决方案是双方能力耦合实现商业化的开端,也是中国...……更多
亲探|刷掌支付、AI大模型……最前沿的金融科技亮相金融展
...形象。这样的技术实现,背后搭载了新华三的百业灵犀大模型。在今年的金融展上,新华三全面展示了在金融AIGC领域的创新技术和应用,还包括全栈算力底座、金融技术服务和最佳实践等内容。新华三金融架构师卢爱周向北京...……更多
国产大模型的100种可能
...力为代表的底层基础设施层发力。更有人直言,相比于“神仙打架”,更关心国产大模型怎么落地应用,看看这个先进生产力工具究竟如何改变产业与生活方式,以及能否实现超越,由追随到引领?关于“与OpenAI差距”的讨论也...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
今日值得关注的大模型前沿论文SwiftEdit:50 倍速文本引导图像编辑清华团队提出大模型“密度定律”足球领域首个视觉语言基础模型Aguvis:首个完全自主的纯视觉 GUI agentGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...发展的道路上,科技巨头们曾经竞相开发规模庞大的语言模型,但如今出现了一种新趋势:小型语言模型(SLM)正逐渐崭露头角,挑战着过去“越大越好”的观念。视觉中国当地时间8月21日,微软和英伟达相继发布了最新的小型...……更多
AI大模型加持,商汤科技的产品多元化与商业化加速
...源包括:基于通用 AI 基础设施的SenseCore、“日日新”大模型体系研发的多个生成式AI产品商量、秒画、如影、琼宇、格物,为智慧商业、智慧生活、智慧汽车、智慧城市四个场景板块的客户提供相关能力和服务方案。而这样的营...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
...大厂在内的20多家公司公布了自研AI大模型,“就连上古神仙的名字都不够用了”。顷刻间,光年之外的戏剧化故事,似乎应验了通用大模型很难属于创业公司的预言。越来越多的公司开始逃离大模型神话。时间回到一年前。在...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...机系的三年级博士生,研究方向涉及 MLSys 和高效大语言模型。师从栗力、须成忠教授。大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意...……更多
医疗人工智能未来将如何布局?
...的服务可以解决患者在挂号时面临的困惑。”医渡科技大模型基于“医疗智能大脑”YiduCore建立,在过去的十年里,它经授权处理分析了超过40亿份医疗记录,积累了大量多维度可量化的知识图谱。通过自主研发的数据生成技术...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...忧——传统软件问题尚能引发如此大的问题,那么站在大模型时代当下,AI+金融,是否又能做到准确可信?正所谓实践是检验真理唯一标准,要回答的这个问题,我们不妨了解一下已经在金融领域“上岗”了的AI大模型。大模型...……更多
腾讯To B五周年碰上大模型 汤道生:一直朝着解决问题的方向前行
...To B业务的窗口。今年大会的特别之处,在于腾讯混元大模型的正式亮相,也在于恰逢腾讯To B五周年。在大会期间,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生接受了包括《每日经济新闻》记者在内的媒体采访。作...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
文|罗曾近年来,大模型飞速发展,但同时也面临一些问题。7月30日,在2024京东云峰会上,京东探索研究院院长、京东科技人工智能业务负责人何晓冬博士深入剖析了大模型面临的困境,并提出了解决之道。何晓冬博士指出,...……更多
...预见它的到来并来得及向全世界发出警报?随着大型语言模型,如ChatGPT的兴起,这个问题最近受到了很多关注。这些模型随着规模的增长已经获得了大量新功能。一些研究结果指向了“涌现”现象,即人工智能模型以一种骤然...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
代码模型SFT对齐后,缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的...……更多
业内聚焦:纷纷开启商业化,大模型公司将走向何方?
...电(中新财经记者 吴涛)随着人工智能技术的快速发展,大模型公司纷纷涌现,它们竞相推出自己的模型产品,试图在这个市场中占据一席之地。然而,随着竞争的加剧和市场的变化,不少观点认为,“百模大战”进入到现阶段,...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造更高效释放场景能力的智能办公平台。最强理科能力!商汤“日...……更多
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处理所有类型的图像。相比于以往的图...……更多
更多关于科技的资讯:
Roxtec电缆和管道密封技术赋能济南地下管廊 为城市生命线安全 “护航”
随着城市化的快速发展,地下综合管廊已成为城市运转不可或缺的“隐形动脉”,承担着输送能源与信息的重要任务。济南市工业北路沿线工厂众多
2025-01-03 19:52:00
华为鸿蒙next5.0来袭,新增应用锁功能
每次提到手机系统的时候,原生鸿蒙就被提及,原因是其证明了中国人独立自主、自力更生的强大精神力量,这也是华为品牌影响力能够得到很大幅度提升的关键
2025-01-03 19:58:00
中新经纬1月3日电 题:电商运营模式差异决定补贴受益程度作者 司东海 巨丰投顾高级投资顾问1月3日上午,国务院新闻办公室举行“中国经济高质量发展成效”系列新闻发布会
2025-01-03 20:57:00
得物App开放日活动,身临其境体验正品保障全流程
如今,线上购物已成为人们日常生活不可或缺的一部分,而如何在海量商品中甄选出真正值得信赖的正品,成为了每一位消费者关注的焦点
2025-01-03 21:14:00
挥杆结缘品味清雅: 国缘V9高尔夫赛事成功营销案例复盘
近日,白酒行业在经济复苏与消费场景恢复的推动下稳步发展,高端白酒市场竞争愈发激烈。在此背景下,今世缘酒业的国缘V9凭借独特的高尔夫赛事营销项目成功突围
2025-01-03 21:49:00
又一位安徽餐饮老板要IPO,老乡鸡9个月收入近50亿,有望成“中式快餐第一股”
快餐的生意越来越不好做。 紧随小菜园,又一安徽餐饮品牌冲击港交所,这次是老乡鸡。撤回上交所主板上市申请近1年半后,1月3日
2025-01-03 22:14:00
美国科研新突破:抗老“神器”PSSOPP诞生,掀起社会热议浪
长生不老,这一人类亘古以来的梦想,正逐渐在科学的助力下变为现实。全球顶尖的研发机构纷纷投入大量的人才和资源,致力于寻找青春永驻的秘诀
2025-01-03 17:01:00
与拜耳分手自建销售团队,糖尿病市场老将陆宇加盟华领医药,华堂宁未来怎么卖?
华领医药组建销售团队。 2025年开年,华领医药(02552.HK)组建销售团队有了新进展。1月1日,华领医药对外宣布
2025-01-03 17:13:00
7000mAh超大电池!真我Neo7限时回归首销价:2099元起
快科技1月3日消息,在今天下午的不良人限定版发布会上,真我Neo7宣布限时重回首销价,2099元起。这是目前2K档最热门的机型之一
2025-01-03 17:14:00
国漫典藏级定制!真我Neo7《画江湖之不良人》限定礼盒发布:2899元
快科技1月3日消息,今天下午,真我Neo7《画江湖之不良人》限定版礼盒正式发布,售价2899元(16GB+512GB)
2025-01-03 17:14:00
老外评PS5十大年度游戏:《宇宙机器人》强势夺冠 《黑神话》第六
PushSquare之前曾开启过“2024年十大PS5游戏”的用户投票,每名玩家最多可以为五款游戏投票,共计12652有效票数
2025-01-03 17:14:00
499元配置良心!王腾:REDMI 14C没做任何宣传的情况下爆火了
快科技1月3日消息,日前,REDMI百元入门新机——REDMI 14C发布,起售价仅499元,新机配置十分良心,不仅有120Hz高刷新率屏幕
2025-01-03 17:15:00
男子利用小程序Bug逃匿28万加油费:获刑4年
1月3日消息,日常生活中确实会有不少“聪明人”,善于发现利用一些漏洞来为自己谋私利,然而这种行为往往会给自己带来严重的后果
2025-01-03 17:15:00
近日,国家医疗保障局(以下简称“国家医保局”)在北京举办“五年筑基 智启未来”医保码五周年活动,渤海银行股份有限公司(以下简称“渤海银行”)受邀参加并荣获“医保码优秀合作伙伴”证书
2025-01-03 17:20:00
本文转自:人民网人民网北京1月3日电 (记者王震)2024年12月29日,由国家制造强国建设战略咨询委员会指导,中国工业经济联合会联合十多家全国性行业联合会(协会)共同举办
2025-01-03 17:36:00