• 我的订阅
  • 头条热搜
AMD Zen 5线程撕裂者现身
...作室用户来说,除了视频以及特效渲染等之外,AI推理与训练也成为了行业的香饽饽,因此需要CPU在AI上有着更好的优化,预计AMDZen5线程撕裂者处理器将会针对流行的AI模型进行特别的优化,从而让工作室在特定AI模型上取得飞一...……更多
RLHF不够用了,OpenAI设计出了新的奖励机制
...值观保持一致,我们需要定义期望行为并收集人类反馈来训练「奖励模型」。这种模型通过发出期望的动作来指导 AI。但是,收集这些常规和重复任务的人类反馈通常效率不高。此外,如果安全政策发生变化,已经收集的反馈可...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在数据和训练方法上并不透明,无法满足真正的科学研究需求。 ...……更多
美国多名作家起诉meta、微软训练ai模型
...,指控Meta、微软等科技巨头未经许可使用他们的作品来训练AI模型。图源Pixabay这一作家团体周二提交了拟议集体版权诉讼,文件称Meta和微软采用了具有争议的“Books3”数据集来训练他们的大模型,告诉大模型如何回应人类的提...……更多
...展这一内置加速器,第五代至强可以进一步提升深度学习训练和推理性能,能够在不增加硬件和系统复杂性的前提下,获得类似于使用独立加速器的性能,让调优深度学习模型或训练中小模型等工作都只需几分钟即可完成。此外...……更多
百度All in的大模型何时能赚钱?
...种是构建基础大模型,只有少数企业会自建大模型,因为训练大模型的成本和技术壁垒都非常高。 第二种是建立行业大模型,通常是了解行业的企业,结合自身掌握的行业数据,用基础大模型精调出更贴合实际场景的行业大模...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
... 实现。数据集对于 APE 工作流程,我们需要一个数据集来训练优化器 LLM。为了实现性能提升,我们需要使用 LLM 难以正确处理的数据集 / 任务。比如几何形状就是 LLM 难以正确应对的领域。对这些模型来说,空间推理和解释抽象...……更多
比ChatGPT省电10倍 Google研训练AI模型新方法
...见及此,Google DeepMind研究团队近日提出一种加快人工智能训练的新方法,使用多模态对比学习与联合范例选择(JEST)能大大减少训练人工智能所需的计算资源和时间,其迭代次数比现在少13倍而运算量也少10倍,成功超越最先进...……更多
麻省理工学院联合metaai开发streamingllm框架
...二个挑战:目前流行的大语言模型,难以泛化适用“超过训练序列长度”的长文本。IT之家注意到,过去有许多研究试图解决上述挑战,像是“扩展注意力窗口”,让语言模型能够处理超出预训练序列长度的长文本;或是建立一...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...层面。1、在大模型层面,围绕建设模型服务生态、模型训练降本增效,千帆大模型平台做了一定的升级:预制的基础/行业大模型数量增长至54个;发布数据统计分析、数据质量检查等功能;推出自动化+人工的双重模型评估机制...……更多
大模型“免费”送,厂商们图什么?
...发凸显。由于需要采购高性能计算机,并且需要进行模型训练,大模型的成本异常高昂。以OpenAI为例,其训练GPT-4的FLOPS约为2.15e25,一次训练成本为6300万美元。TheInformation报道,2022年,OpenAI亏损约为5.4亿美元左右,约扩大一倍。...……更多
如何识别AI安全风险?中国工程院院士邬江兴:尽量避免使用单一模型,要交叉验证
...。”他举例说,在数据安全方面,生成式AI要依靠数据来训练,但数据如果被污染了怎么办?此外,人工智能在训练中有时要用到个人信息,甚至是商业秘密,相关方的权益该怎么保证?个人是不是有信息权益保护方面的诉求?...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...大模型通常具备各种安全特性,比如响应过滤或通过特定训练阻止输出危险或令人厌恶的响应。 如果模型权重被释放出来,那么重新训练模型来跳过这些「护栏」就变得容易多了。这使得利用这些开源模型来制作网络钓鱼软件...……更多
大模型时代的阿里云,将云计算进行到底
...看,未来AI算力取代通用算力充满确定性,不止是目前的训练需求,未来推理需求将远超训练需求,以大模型算力为云的基本盘,是云厂商必须抓住的大生意。除了算力之外,大模型能够提高云计算的附加值,直接提升毛利。IaaS...……更多
...参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI for Science等科研工作。据介绍,Qwen-72B可以处理最...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
...的开源和软件开源有本质区别——开源模型因其并未开放训练源代码、预训练和精调数据等影响模型效果的关键信息,所以无法像开源软件一样,靠社区开发者一起参与来提升效果和性能,而基座模型的训练只能掌握在厂商自己...……更多
深度势能核心开发者团队发布“大原子模型计划”
...时开展比赛、培训交流,与领域开发者协作推动建立供预训练与评估的数据集等。作为OpenLAM计划的前期探索,覆盖元素周期表70种元素的 DPA-1 深度势能原子间势函数预训练模型,证明了微观模拟实现“预训练+少量数据微调”的...……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...h Alpha之前还开发了拥有700亿参数(大约是GPT-3的2/5)的预训练模型Luminous,并在其基础上训练了聊天机器人Lumi。该公司成立于2019年,通常被视为欧洲在AI领域的重要参与者之一。2023年11月7日,该公司宣布获得超过5亿美元(折合...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...作,风格改写,内容续写等多个媒体相关任务下进行微调训练,以提高模型的可用性。多模态向量检索技术:利用向量库将多模态信息转成向量,通过向量检索技术,建立了一个高效的资源检索框架,用户可通过多种方式快速找...……更多
摩尔线程GPU千卡集群完成师者AI 70亿参数教育大模型训练测试
...科教育AI大模型“师者AI”联合宣布,双方已完成大模型训练测试。师者AI基于摩尔线程夸娥(KUAE)千卡智算集群,完成了其70亿参数大模型的高强度训练测试。整个训练过程用时一周,训练效率达到预期,充分展示了夸娥千卡智...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...披露。还有细心的网友从中发现了华点——苹果大模型的训练用的是谷歌TPU集群,英伟达含量竟然为零。Siri升级,但ChatGPT暂未接入要想体验到苹果的Apple Intelligence,需要满足的条件有不少。首先,搭载它的iOS 18.1 Beta版目前是99...……更多
openai公司宣布改善微调api,进一步扩展定制模型计划
...调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍)的训练过程)过程中,都自动生成一个完整的微调模型检查点,便于减少后续重新训练的需要,尤其是在过...……更多
阿里云的AI路线图
...技术,基础大模型质量很大程度决定了AI产业化的前景。训练大模型是囊括了算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程。在算力馆,阿里云完整地展示了算力全技术栈的核心硬件、IT基础设施、云...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...了令高期待的市场与投资者留下印象,各家AI公司只能卷训练参数、卷榜单、卷新品……如果不能让人印象深刻,那么,只能先耍“小花招”。盘点AI大模型公司2023年耍的“花招”,一个奇妙的规律出现了:这些手段竟然那么简...……更多
关于 Sora,我有十个小白问题
...据官方的说法,他们利用 DALL·E 3 的 re-captioning 功能,给训练用的视频素材都加上了高质量文本描述,表示这样可以提高输出视频的整体质量。另外,你给的简短描述词,AI 收到后会进一步扩写,再交由 Sora 生成。更重要的是,S...……更多
真香!智谱大模型,有了首个免费的API
...样做既符合了业务场景,也不需要进行复杂的调整或重新训练。如果你认为基础模型无法满足复杂任务的需求时,使用微调可以获得更好的效果。微调可以让大模型表现出特定的风格,或是提高输出的可靠性,让大模型可以完成...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...播的同学为原型,通过拍摄绿幕视频并结合声音数据进行训练而成,“娇娇”可以进行对话聊天、口播、歌曲演唱、新闻播报、健康顾问、多语种口译等工作。“娇娇”不仅体现了数字人在娱乐、教育等领域的广泛应用潜力,还...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。△在CNCC,智谱AI CEO张鹏发布新一代模型在论坛上,智谱AI发布了新一代的中英双...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...LLM数学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过...……更多
更多关于科技的资讯:
理想智驾负责人郎咸朋:李想对我发过一次火 智驾做不到头部就不用干了
快科技12月26日消息,理想汽车今日晚间举办“2024理想AI Talk”。主持人问道,听说李想对智驾团队曾发了很大的火
2024-12-26 20:37:00
帧率提升200%!AMD RX 7900 XT挑战5款FSR 3.0大作
一、前言:蓝宝石RX 7900 XT极地挑战5款FSR 3游戏今年最火的游戏当属《黑神话:悟空》无疑,它也可能是目前为止最为消耗显卡资源的3A大作
2024-12-26 20:37:00
赵孝国:立足品质,餐饮行业需要一次“重塑”
12月26日,2024山东餐饮零售业品牌影响力巡礼活动成功举办。来自餐饮界的大咖、精英对话交流,为从业者提供发展新思路
2024-12-26 20:38:00
餐饮行业如何平稳穿越行业周期?行业大咖们这样说!
12月26日,“2024山东餐饮零售业品牌影响力巡礼”表彰大会在济南舜耕山庄隆重举办。此次大会汇聚了众多餐饮零售行业的精英大咖
2024-12-26 20:41:00
贵阳第二家学习“胖东来”模式 永辉超市新世界花园店12月27日开业
多彩贵州网讯(本网记者 文彬 陈仕发) 历时31天闭店调改,永辉超市贵阳新世界花园店将于12月27日9:00重新开业。作为贵阳第二家学习 胖东来模式调改开业的门店
2024-12-26 20:47:00
小米平板7即将在印度发布 主打生产力 国行早已开售
【CNMO科技消息】近日,小米正式宣布,其最新平板——小米平板7即将登陆印度市场。根据亚马逊的预热页面显示,这款平板的印度发布会将于2025年1月10日举行
2024-12-26 20:54:00
真我14 Pro+曝光 1.5K等深四微曲屏+潜望长焦稳了
【CNMO科技消息】前不久发布的真我Neo7新品,可以说是凭借着7000mAh的泰坦电池、天玑9300+、IP69+IP68满级防水以及首销2099元起的价格杀疯了
2024-12-26 20:55:00
苹果 iOS 19兼容性曝光:最低门槛提升至A12芯片
【CNMO科技消息】根据外媒透露,苹果公司下一代操作系统更新的设备兼容性情报已提前外泄。所有当前能够运行iOS18的iPhone型号预计也将继续获得iOS19的支持
2024-12-26 20:55:00
华为Mate X6销量超越Mate70 Pro?果然强得飞起
【CNMO科技消息】现在距离华为Mate品牌盛典过去也有将近一个月时间了,包括此前上市的Mate70系列和MateX6依旧是一机难求的状态
2024-12-26 20:55:00
曝OPPO或首发新款天玑次旗舰芯片 两大子品牌Q2发力
【CNMO科技消息】今年10月24日,OPPO发布了OPPOFindX8及OPPOFindX8Pro,全球首批搭载联发科天玑9400芯片
2024-12-26 20:55:00
采访商佑安:做品牌是远程攻击,不要总想着肉搏
第一次见观速咨询商佑安老师是在11月底,是在9月底,在新加坡举办的“以品牌为中心的第二次增长”为主题的营销会上,来的嘉宾很多传统企业和新加坡快餐连锁行业的CEO
2024-12-26 20:55:00
一加Ace 5系列详细参数汇总:全面升级 或2399元起
【CNMO科技消息】一加Ace5系列将于明日(12月26日)14:30发布。12月25日,博主@数码闲聊站汇总了一加Ace5系列的详细参数
2024-12-26 20:56:00
荣耀公布MagicOS 9.0五大升级亮点
【CNMO科技消息】据CNMO了解,荣耀MagicOS9.0第二波升级已经到来,官方总结了五大升级亮点,包括YOYO智能体
2024-12-26 20:57:00
华为手环10曝光,或与华为Pura 80同台亮相
据报道称,华为手环10已经通过了印尼SDPPI认证和TUVSUD认证,同时认证显示该款设备支持IP68级别防尘防水性能
2024-12-26 20:58:00
OPPO A5 Pro支持360°抗摔:通过多项军标环境测试
2024年12月24日,OPPO推出A5Pro手机,该产品以卓越的360°抗摔性能引发了行业内外的广泛关注,其实现了全方位的防护
2024-12-26 20:58:00