• 我的订阅
  • 头条热搜
openai公司宣布改善微调api,进一步扩展定制模型计划
...I公司近日发布新闻稿,宣布改善微调(fine-tuning)API,并进一步扩展定制模型计划。IT之家翻译新闻稿中关于微调API的相关改进内容如下基于Epoch的CheckpointCreation在每次训练epoch(将训练数据集中的所有样本都过一遍(且仅过一遍...……更多
2个大模型发布!贵阳大数据科创城行业大模型进一步集聚
...—星云AI云平台、法律咨询垂类大模型——法管家2.0,这进一步丰富了大科城行业大模型集聚,有效推动国家大数据(贵州)综合试验区人工智能训练场建设发展。星云(贵州)科技有限公司执行董事、总经理许靖东介绍,医学...……更多
Nature封面:AI训AI 越训越傻
...模型的误差为0,它就会生成原始的wikitext2数据集。为了进一步感受区别,他们采用两种不同的设置:一组是除了最开始训练,后续过程没有任何原始训练数据;另一组则是保留10%的原始数据。结果显示,随着时间推移,模型产...……更多
...于好的一面。虽然字节跳动很少使用我们的API,但我们在进一步调查期间已暂停了他们的帐户。如果我们发现他们的使用不符合公司政策,我们将要求他们做出必要的改变或终止他们的账户。”菲利克斯表示。微软发言人弗兰克...……更多
本文转自:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问...……更多
...,通过亿微征信所在行业的优势积累,黑马天启大模型将进一步拓展至征信、背调等企业服务、政务服务、金融服务相关的垂类行业模型开发。本次合作符合公司整体发展战略规划,能够与现有业务形成有效协同。 ……更多
ChatGPT一周年,机会在大厂还是小公司?
...也是大模型变成人类助手的巨大阻碍。因此,在他看来,进一步压缩大模型,甚至创造出新的架构,降低计算成本,让所有人都能用得起。大模型“平民化”的过程,也蕴含着大量机会。不过,很显然,不是所有人和公司都能在...……更多
...经理魏子沛表示,基于丰富的公共交通行业数据,公司将进一步深化物联网、云计算、大数据、大模型等技术的赋能作用。“截至2022年,连接到互联网上的物联网设备已经是网民的4.3倍多。这些物联网设备是我们平时见到的安...……更多
...快发布相关服务,就能获取更多的用户和行业反馈,从而进一步加速各自大模型的迭代和应用,获得尽可能多的竞争优势。”联想控股股份有限公司副总裁兼前瞻技术研究院院长于浩说。大模型将为个人和产业赋能已经上线的国...……更多
电力大模型:“聊、查、图、写”样样精通
...样本获取难、研发成本高等因素一直制约着它在该行业的进一步应用。为推进新型电力系统建设,助力能源电力行业数字化转型,南方电网公司启动了人工智能平台的自主研发工作。目前,人工智能平台已经构建完成,可面向内...……更多
百度CTO王海峰:文心大模型的底色和成色
...3.0和3.5版本一脉相承,升级是基于在多个关键技术方向上进一步的创新突破。首先是训练环境更优了。文心大模型的基础模型训练离不开飞桨深度学习平台。王海峰透露,百度技术团队将飞桨平台运行在万卡算力上,并通过集群...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...数据“采、洗、标、测、用”五位一体的工具链能力。为进一步激发市场主体语料创新活力,增强供给侧能级,加速医疗健康、城市交通、消费零售、金融、影音等重点行业的大模型产业发展,库帕思携手咪咕视频、宝信软件、...……更多
Llama3.1根本卖不动!业内人士:开源模型成本反而更高
Meta的开源大模型Llama 3在市场上遇冷,进一步加剧了大模型开源与闭源之争的关注热度。据外媒The Information报道,Meta的开源大模型Llama 3一直难以在全球最大云厂商——亚马逊的AWS上获得关注,AWS的企业客户更倾向于使用Anthropic...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...token的DCLM-baseline数据集来自于总量240T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。 上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...态生成未来发展的信心。随着Scaling Law在视频生成领域的进一步加强,我们预期多模态技术将引领一系列令人瞩目的创新和令人惊叹的成果。在这一过程中,生数科技无疑将扮演一个关键的推动角色!达泰资本合伙人姚承在当下...……更多
谷歌在AI赛道加速
...、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高质量的数据集,引导技术就会失效。这意味着,相比...……更多
...页,虽然我们花费了很大力气清洗,但数据质量确实需要进一步提高。‘源2.0’减少了网页数据,增加了书籍、期刊等的数据,并引入代码和数学数据,使模型数理逻辑能力进一步增强。”不仅如此,“源2.0”还将实行全面开源...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...重大突破,开发了新版的信任和安全工具,相比Llama 2,进一步降低了误拒率,增强了模型的一致性。Meta目前还在研发Llama 3超400B的参数模型,有望与GPT-4一较高下。Llama 3很快将在亚马逊、谷歌、微软、英伟达等云厂商和大模型AP...……更多
2023金融大模型报告|智能交易:求解知易行难
...能。通过大模型的助力,未来金融服务的效能将有望得到进一步提升与飞跃。多点开花以大模型为代表的新一代人工智能技术逐渐成为数字经济新的增长点,一场大模型之战正在打响。作为AIGC应用的主战场,在金融机构投研决...……更多
国泰君安:Sora大模型的发布将进一步拉大算力缺口
国泰君安研报表示,Sora大模型的发布将进一步拉大算力缺口。Sora大模型延续了此前GPT模型“源数据-Transformer-Diffusion-涌现”的技术路径,这意味着其发展成熟同样需要海量数据+大规模参数+大算力作为基座,且由于视频训练所...……更多
毫末智行与火山引擎联手,建设自动驾驶智算中心MANA OASIS|最前线
...、ByteCCL通信优化能力以及大模型训练框架,可以让算力进一步优化;在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本...……更多
...I 已在北京、上海、深圳、郑州数据交易所挂牌。 公司将进一步提升数据要素变现能力,专注优势产品,做精做细,做优做强,并建立专注行业SaaS产品的营销团队,不断拓展生态布局,丰富数据要素的流通与变现渠道。 ……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...haria-1-LLM-7B-control-aligned)。其中,“对齐”版模型经过了进一步的训练,目的是降低模型输出中的有害内容和偏见,从而提高模型的安全性和可靠性。这两个模型都在多语言基础语料库上训练,并针对德语、法语和西班牙语进行...……更多
生成式AI在金融行业的应用及思考
...演讲的精华,共2100字,阅读时间大约是10分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。生成式人工智能在近年来迅速崛起,引发了广泛关注和热议。在这场由亚马逊云科技金...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...nAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说...……更多
...召开的“AI赋能 产业焕新”中央企业人工智能专题推进会进一步强调了人工智能在推动产业发展中的重要作用,并明确指出中央企业要主动拥抱人工智能带来的深刻变革,将发展人工智能放在全局工作中统筹谋划。那么,国投智...……更多
张云泉:集中力量,促进国产AI大模型发展
...辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步渗透的关键因素。2024年8月21日,观众在北京世界机器人大会上参观(李欣/摄)以OpenAI ChatGPT为代表的通用人工智能的快速发展,预示着全球新一轮科技革命和产业变...……更多
...究机构。这些应用产品是科技公司在开源大模型的基础上进一步开发完成的。金融机构更多的是采购科技公司提供的方案,也有一些探索是设计一些Agent用大模型来解决自己的研发能力的问题。高校等研究机构在做自己的开源模...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...复杂问题并验证输出内容,代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...引用 / 定位训练。团队还进行了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类...……更多
更多关于科技的资讯:
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00
陕西数字贸易闪耀第四届数贸会 数字贸易合作成果丰硕
9月29日,为期5天的第四届全球数字贸易博览会(以下简称“数贸会”)在浙江杭州大会展中心圆满落下帷幕。此次盛会,陕西代表团表现亮眼
2025-10-01 18:58:00
高德扫街榜国庆提醒:全国十大吃货友好高铁站看这里
2025年国庆节与中秋节叠加,全国铁路预计发送旅客2.19亿人次。赶高铁如何吃饱吃好?今天,高德扫街榜发布“十大吃货友好高铁站”
2025-10-01 20:19:00
能效提升15%,山东港口日照港顺岸式全自动化码头再迎新突破
9月29日,在山东港口日照港全自动化集装箱码头,随着A23自动化轨道吊精准将集装箱吊起、转运,标志着日照港研发的新一代双悬臂轻量化轨道吊投产试运行
2025-10-01 23:08:00