• 我的订阅
  • 头条热搜
openai公司宣布改善微调api,进一步扩展定制模型计划
...I公司近日发布新闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍...……更多
2个大模型发布!贵阳大数据科创城行业大模型进一步集聚
...—星云AI云平台、法律咨询垂类大模型——法管家2.0,这进一步丰富了大科城行业大模型集聚,有效推动国家大数据(贵州)综合试验区人工智能训练场建设发展。星云(贵州)科技有限公司执行董事、总经理许靖东介绍,医学...……更多
Nature封面:AI训AI 越训越傻
...模型的误差为0,它就会生成原始的wikitext2数据集。为了进一步感受区别,他们采用两种不同的设置:一组是除了最开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。结果显示,随着时间推移,模型产...……更多
...于好的一面。虽然字节跳动很少使用我们的API,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不符合公司政策,我们将要求他们做出必要的改变或终止他们的账户。”菲利克斯表示。微软发言人弗兰克...……更多
本文转自:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问...……更多
...,通过亿微征信所在行业的优势积累,黑马天启大模型将进一步拓展至征信、背调等企业服务、政务服务、金融服务相关的垂类行业模型开发。本次合作符合公司整体发展战略规划,能够与现有业务形成有效协同。 ……更多
ChatGPT一周年,机会在大厂还是小公司?
...也是大模型变成人类助手的巨大阻碍。因此,在他看来,进一步压缩大模型,甚至创造出新的架构,降低计算成本,让所有人都能用得起。大模型“平民化”的过程,也蕴含着大量机会。不过,很显然,不是所有人和公司都能在...……更多
...经理魏子沛表示,基于丰富的公共交通行业数据,公司将进一步深化物联网、云计算、大数据、大模型等技术的赋能作用。“截至2022年,连接到互联网上的物联网设备已经是网民的4.3倍多。这些物联网设备是我们平时见到的安...……更多
...快发布相关服务,就能获取更多的用户和行业反馈,从而进一步加速各自大模型的迭代和应用,获得尽可能多的竞争优势。”联想控股股份有限公司副总裁兼前瞻技术研究院院长于浩说。大模型将为个人和产业赋能已经上线的国...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...了退火最佳数据量和最佳配比,以及学习率变化方式等,进一步提升了模型训练效果。在 Post-Training(后训练)方面,TeleAI 首先针对数学、代码和逻辑推理等内容合成了大量问答数据,用于 SFT(监督式微调)第一阶段模型训练...……更多
电力大模型:“聊、查、图、写”样样精通
...样本获取难、研发成本高等因素一直制约着它在该行业的进一步应用。为推进新型电力系统建设,助力能源电力行业数字化转型,南方电网公司启动了人工智能平台的自主研发工作。目前,人工智能平台已经构建完成,可面向内...……更多
百度CTO王海峰:文心大模型的底色和成色
...3.0和3.5版本一脉相承,升级是基于在多个关键技术方向上进一步的创新突破。首先是训练环境更优了。文心大模型的基础模型训练离不开飞桨深度学习平台。王海峰透露,百度技术团队将飞桨平台运行在万卡算力上,并通过集群...……更多
苹果发布mm1.5-ui模型
...模型在多项基准测试中表现优异,但苹果团队仍计划通过进一步融合文本、图像和用户交互数据,并设计更复杂的架构,来提升模型对移动设备UI的理解能力,从而让“苹果牌”AI更强大。 ……更多
AI数据之战:大模型的“燃料”还能烧多久?
...数据“采、洗、标、测、用”五位一体的工具链能力。为进一步激发市场主体语料创新活力,增强供给侧能级,加速医疗健康、城市交通、消费零售、金融、影音等重点行业的大模型产业发展,库帕思携手咪咕视频、宝信软件、...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...token的DCLM-baseline数据集来自于总量240T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。 上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...态生成未来发展的信心。随着Scaling Law在视频生成领域的进一步加强,我们预期多模态技术将引领一系列令人瞩目的创新和令人惊叹的成果。在这一过程中,生数科技无疑将扮演一个关键的推动角色!达泰资本合伙人姚承在当下...……更多
谷歌在AI赛道加速
...、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高质量的数据集,引导技术就会失效。这意味着,相比...……更多
...页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”不仅如此,“源2.0”还将实行全面开源...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型AP...……更多
2023金融大模型报告|智能交易:求解知易行难
...能。通过大模型的助力,未来金融服务的效能将有望得到进一步提升与飞跃。多点开花以大模型为代表的新一代人工智能技术逐渐成为数字经济新的增长点,一场大模型之战正在打响。作为AIGC应用的主战场,在金融机构投研决...……更多
国泰君安:Sora大模型的发布将进一步拉大算力缺口
国泰君安研报表示,Sora大模型的发布将进一步拉大算力缺口。Sora大模型延续了此前GPT模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要海量数据+大规模参数+大算力作为基座,且由于视频训练所...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...、ByteCCL通信优化能力以及大模型训练框架,可以让算力进一步优化;在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本...……更多
...I 已在北京、上海、深圳、郑州数据交易所挂牌。 公司将进一步提升数据要素变现能力,专注优势产品,做精做细,做优做强,并建立专注行业SaaS产品的营销团队,不断拓展生态布局,丰富数据要素的流通与变现渠道。 ……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...haria-1-LLM-7B-control-aligned)。其中,“对齐”版模型经过了进一步的训练,目的是降低模型输出中的有害内容和偏见,从而提高模型的安全性和可靠性。这两个模型都在多语言基础语料库上训练,并针对德语、法语和西班牙语进行...……更多
生成式AI在金融行业的应用及思考
...演讲的精华,共2100字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。生成式人工智能在近年来迅速崛起,引发了广泛关注和热议。在这场由亚马逊云科技金...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...nAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说...……更多
...召开的“AI赋能 产业焕新”中央企业人工智能专题推进会进一步强调了人工智能在推动产业发展中的重要作用,并明确指出中央企业要主动拥抱人工智能带来的深刻变革,将发展人工智能放在全局工作中统筹谋划。那么,国投智...……更多
张云泉:集中力量,促进国产AI大模型发展
...辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步渗透的关键因素。2024年8月21日,观众在北京世界机器人大会上参观(李欣/摄)以OpenAI ChatGPT为代表的通用人工智能的快速发展,预示着全球新一轮科技革命和产业变...……更多
...究机构。这些应用产品是科技公司在开源大模型的基础上进一步开发完成的。金融机构更多的是采购科技公司提供的方案,也有一些探索是设计一些Agent用大模型来解决自己的研发能力的问题。高校等研究机构在做自己的开源模...……更多
更多关于科技的资讯:
莱西市夏格庄镇:政企同频创新培育新动能
鲁网9月30日讯(记者 葛万彩 通讯员 张磊)引进14个亿元以上高新技术项目,其中8个已开工建设;新投产的青岛新茂林机械装备制造基地
2025-09-30 10:41:00
谨防“二选一”换上新马甲
范仁超据多家媒体报道,在天猫、京东、抖音等多个平台开店的某化妆品品牌负责人日前向媒体反映,之前和某带货达人达成合作意向
2025-09-30 10:48:00
胶东在线9月28日讯(记者 卢伟霞)近日,以“山海有约 烟台有乐”为主题的2025烟台沙滩音乐季在幸福湾活力海岸圆满收官
2025-09-30 06:37:00
京津研发河北转化进行时(三):一个康复机器人的协同样本
从北京研发中心到冀州生产线一个康复机器人的协同样本9月25日,在位于衡水市冀州区的极智医疗器械(河北)有限公司生产车间
2025-09-29 08:26:00
东风与腾讯签署战略合作协议 共建“汽车+互联网”智能新生态
9月28日,东风汽车集团股份有限公司(以下简称“东风汽车”)与深圳市腾讯计算机系统有限公司(以下简称“腾讯”)在武汉举行战略合作签约仪式
2025-09-29 08:33:00
大厂:发放第二期惠民电子消费券 为消费市场注入新活力
河北新闻网讯(张嘉良)消费热潮涌动,市场活力持续攀升。日前,大厂回族自治县发放第二期“乐享大厂·焕新潮”惠民电子消费券
2025-09-29 09:49:00
唐山启动2025“迎国庆、庆中秋”系列促消费活动
河北新闻网讯(张强、王育民)9月27日,2025唐山市“迎国庆、庆中秋”系列促消费活动在路南区京东电器城市旗舰店启动。本次活动由唐山市商务局
2025-09-29 10:28:00
中新经纬9月29日电 29日,中新经纬查询中国执行信息公开网发现,该网站已经没有万达集团董事长王健林“限高”信息。28日
2025-09-29 10:58:00
京东服务商开放季交流会释放11.11商家增长信号
齐鲁晚报·齐鲁壹点 记者 王颖颖2025年9月28日,在年度电商盛宴京东11.11启幕前夕,以“开放共赢 高效合作”为主题的2025京东服务商开放季交流会在京东集团总部成功举行
2025-09-29 11:00:00
官宣!普拉斯与腾讯云深化“云+AI”合作,加速制造业智能转型
近日,四川省宜宾普拉斯包装材料有限公司(下称“普拉斯”)宣布与腾讯云深化战略合作,双方将基于普拉斯在智慧包装行业的丰富经验和腾讯在AI领域的领先技术
2025-09-29 11:05:00
王健林“限高”措施已取消,其所持4.9亿股权仍被冻结
记者9月29日查询,中国执行信息公开网已经没有万达集团董事长王健林“限高”信息。另据企查查9月29日信息,显示王健林限高措施已取消
2025-09-29 11:37:00
象屿集团与钉钉合作,打造统一、智能、全球化的AI办公平台
9月28日,厦门象屿集团有限公司(以下简称“象屿集团”)与钉钉正式达成合作协议,并宣布象屿集团新一代数字化办公平台项目建设正式启动
2025-09-29 11:37:00
春雪食品集团总裁郑钧谈品质建设与战略转型
近日,春雪食品集团股份有限公司(以下简称“春雪食品集团”)宣布,继去年扭亏为盈后,今年上半年实现归母净利润1427.65万元
2025-09-29 11:37:00
聊城智汇 链接全球丨从布艺收纳到宠物用品,泊西集团海外订单供不应求
鲁网9月29日讯在山东聊城茌平区洪官屯镇,阳光洒在错落有致的乡村院落上。走进山东泊西实业集团有限公司生产基地的产品展厅
2025-09-29 12:06:00
近日,中国广播影视出版社授权华藏数字版权交易平台发布的“广耀星辉”的数字纪念徽章,徽章以精巧的设计和与实体图书深度绑定的模式
2025-09-29 12:36:00