• 我的订阅
  • 头条热搜
openai公司宣布改善微调api,进一步扩展定制模型计划
...I公司近日发布新闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍...……更多
2个大模型发布!贵阳大数据科创城行业大模型进一步集聚
...—星云AI云平台、法律咨询垂类大模型——法管家2.0,这进一步丰富了大科城行业大模型集聚,有效推动国家大数据(贵州)综合试验区人工智能训练场建设发展。星云(贵州)科技有限公司执行董事、总经理许靖东介绍,医学...……更多
Nature封面:AI训AI 越训越傻
...模型的误差为0,它就会生成原始的wikitext2数据集。为了进一步感受区别,他们采用两种不同的设置:一组是除了最开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。结果显示,随着时间推移,模型产...……更多
...于好的一面。虽然字节跳动很少使用我们的API,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不符合公司政策,我们将要求他们做出必要的改变或终止他们的账户。”菲利克斯表示。微软发言人弗兰克...……更多
本文转自:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问...……更多
...,通过亿微征信所在行业的优势积累,黑马天启大模型将进一步拓展至征信、背调等企业服务、政务服务、金融服务相关的垂类行业模型开发。本次合作符合公司整体发展战略规划,能够与现有业务形成有效协同。 ……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...超千亿水平。也就是说,当数据量充足,机器学习就具备进一步升级的可能,而这个可能性在2018年已经存在。但是,仅有数据还不够,伴随着数据使用而来的,还有递增的成本——机器学习环节中使用的数据量越大,所需的数...……更多
ChatGPT一周年,机会在大厂还是小公司?
...也是大模型变成人类助手的巨大阻碍。因此,在他看来,进一步压缩大模型,甚至创造出新的架构,降低计算成本,让所有人都能用得起。大模型“平民化”的过程,也蕴含着大量机会。不过,很显然,不是所有人和公司都能在...……更多
...经理魏子沛表示,基于丰富的公共交通行业数据,公司将进一步深化物联网、云计算、大数据、大模型等技术的赋能作用。“截至2022年,连接到互联网上的物联网设备已经是网民的4.3倍多。这些物联网设备是我们平时见到的安...……更多
...快发布相关服务,就能获取更多的用户和行业反馈,从而进一步加速各自大模型的迭代和应用,获得尽可能多的竞争优势。”联想控股股份有限公司副总裁兼前瞻技术研究院院长于浩说。大模型将为个人和产业赋能已经上线的国...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...了退火最佳数据量和最佳配比,以及学习率变化方式等,进一步提升了模型训练效果。在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练...……更多
芯片“围城”加剧,如何通过“算力运营”加速国产商业落地?
...闲置算力,使国产算力物尽其用?又如何以算力为依托,进一步盘活人工智能市场?针对这些问题,本期第一新声采访并引用了无锡数据集团战略发展部兼无锡市数字新基建公司负责人孙荣锋、原IDC 圈分析师金磊、英诺天使基...……更多
电力大模型:“聊、查、图、写”样样精通
...样本获取难、研发成本高等因素一直制约着它在该行业的进一步应用。为推进新型电力系统建设,助力能源电力行业数字化转型,南方电网公司启动了人工智能平台的自主研发工作。目前,人工智能平台已经构建完成,可面向内...……更多
...和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的小型数据集。“预算强制”则使用了AI模型训练新方法——“测试时扩展...……更多
百度CTO王海峰:文心大模型的底色和成色
...3.0和3.5版本一脉相承,升级是基于在多个关键技术方向上进一步的创新突破。首先是训练环境更优了。文心大模型的基础模型训练离不开飞桨深度学习平台。王海峰透露,百度技术团队将飞桨平台运行在万卡算力上,并通过集群...……更多
苹果发布mm1.5-ui模型
...模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。 ……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...数据“采、洗、标、测、用”五位一体的工具链能力。为进一步激发市场主体语料创新活力,增强供给侧能级,加速医疗健康、城市交通、消费零售、金融、影音等重点行业的大模型产业发展,库帕思携手咪咕视频、宝信软件、...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...token的DCLM-baseline数据集来自于总量240T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。 上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...态生成未来发展的信心。随着Scaling Law在视频生成领域的进一步加强,我们预期多模态技术将引领一系列令人瞩目的创新和令人惊叹的成果。在这一过程中,生数科技无疑将扮演一个关键的推动角色!达泰资本合伙人姚承在当下...……更多
谷歌在AI赛道加速
...、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高质量的数据集,引导技术就会失效。这意味着,相比...……更多
...页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”不仅如此,“源2.0”还将实行全面开源...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型AP...……更多
AI公司是真饿了 开始砸钱买你拍的废片
...频模型成为过去一年大模型最卷的赛道,很多 AI 公司更进一步,直接开始卷可以生成动态场景的「世界模型」,但无论哪种模型,数据养料都离不开视频。于是各大 AI 公司纷纷开始了军备竞赛,谁能拿到更多的视频数据,谁的...……更多
2023金融大模型报告|智能交易:求解知易行难
...能。通过大模型的助力,未来金融服务的效能将有望得到进一步提升与飞跃。多点开花以大模型为代表的新一代人工智能技术逐渐成为数字经济新的增长点,一场大模型之战正在打响。作为AIGC应用的主战场,在金融机构投研决...……更多
国泰君安:Sora大模型的发布将进一步拉大算力缺口
国泰君安研报表示,Sora大模型的发布将进一步拉大算力缺口。Sora大模型延续了此前GPT模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要海量数据+大规模参数+大算力作为基座,且由于视频训练所...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...、ByteCCL通信优化能力以及大模型训练框架,可以让算力进一步优化;在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本...……更多
...I 已在北京、上海、深圳、郑州数据交易所挂牌。 公司将进一步提升数据要素变现能力,专注优势产品,做精做细,做优做强,并建立专注行业SaaS产品的营销团队,不断拓展生态布局,丰富数据要素的流通与变现渠道。 ……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...haria-1-LLM-7B-control-aligned)。其中,“对齐”版模型经过了进一步的训练,目的是降低模型输出中的有害内容和偏见,从而提高模型的安全性和可靠性。这两个模型都在多语言基础语料库上训练,并针对德语、法语和西班牙语进行...……更多
生成式AI在金融行业的应用及思考
...演讲的精华,共2100字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。生成式人工智能在近年来迅速崛起,引发了广泛关注和热议。在这场由亚马逊云科技金...……更多
更多关于科技的资讯:
葵花药业×淘宝闪购签署战略合作:共探“AI+超级入口”下的医药即时零售新范式
11月28日,在2025淘宝闪购“聚势共赢”医药即时电商峰会现场,葵花药业集团与淘宝闪购正式签署战略合作协议,成为淘宝闪购医药健康领域首批战略级合作伙伴之一
2025-12-03 10:11:00
解码三一重能:风电龙头的突围与出海
十月的北京,三一重能南口产业园区内,一座数十米高的风力发电机静静运转,园区内却是一派繁忙景象。作为三一集团在京重要产业集群
2025-12-03 10:11:00
摘要:本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析,探讨薪资分布的现状及其影响因素。研究发现,一线城市和二线城市在薪资水平上存在显著差异
2025-12-03 06:16:00
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00
GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书,成为兼具安全性
2025-12-02 14:27:00
从梅酒到书籍:梅见的文化升维之路
步入繁华的商业街区,不难发现一个耐人寻味的现象:店铺橱窗中的传统文化元素,正以近乎重复的方式不断上演。印着汉字 logo 的T恤
2025-12-02 14:35:00
丝玫瑰携手首玺丽格 科创驱动美力升级
2025年12月2日,由键凯科技旗下医美产品线品牌——丝玫瑰®(SILKROSE)与北京首玺丽格联合举办的“中国‘智’造
2025-12-02 15:35:00
白酒+体育IP重构行业营销新范式,五粮液世界杯联名款京东首发
鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日,五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市
2025-12-02 15:36:00
从“车间老师傅”到“门店销冠”:飞书AI正在重塑吉利汽车研究院、亚朵酒店的一线战场
当AI逐渐褪去神秘面纱,谁是这场技术变革真正的操盘手?答案是:一线业务人。 近日,首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官
2025-12-02 15:58:00
中新经纬12月2日电 题:即时零售不再打“补贴战”了作者 江瀚 盘古智库高级研究员随着资本耐心减弱,单纯依赖补贴拉动的增长已难以为继
2025-12-02 16:09:00