• 我的订阅
  • 头条热搜
每天训练12小时,敲出更有美感的代码
...法国里昂世赛“入场券”——每天训练12小时,敲出更有美感的代码第二届全国职业技能大赛网站技术项目金牌得主庞泽锐。 本报记者 邢千里摄 ■本报记者 占悦深夜的上海信息技术学校,靠近校门的两层小楼亮着灯,键...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友询问到,有没有可能 o1 就着你自己的代码,完成的训练?Kabasares 认为,o1 输出的 200 行代码,与自己 1100 行代码有着很大的不同,这是论文代码「最简版本」。深夜测试,o1 挑战大学、博士物理题为此,Kabasares 又发了第二...……更多
学会和软件代码“交朋友”(工匠绝活)
...件测试“绝活”的时候。这需要通过大量的实际案例进行训练。“在训练过程中要编写大量的自动化测试脚本,覆盖各种常见的测试场景。”叶重涵说,在这个过程中,他需要不断优化代码结构,提高脚本的可维护性和执行效率...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。△在CNCC,智谱AI CEO张鹏发布新一代模型在论坛上,智谱AI发布了新一代的中英双...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
码农真的危了!最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。OpenAI招外包大军,教AI学人类思考会编程的AI,几家硅谷大厂都在做。DeepMind的AlphaCode,...……更多
...了旷视AIS算法生产平台、边缘计算智能分析盒,以及算法训练服务,旨在降低算法生产门槛和成本,使企业能够轻松自主训练所需场景的算法,并将其快速部署到边缘智能分析盒中,实现算法与现实世界的深度融合。此外,旷视...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率的同时提升大模型处理复杂任务的性能,更快地学习复杂任务的同时保证准确性。与稠密模型相比,MoE模型的预训练速度更快;使用MoE 层代替transformer 中的...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...一种自定义图像识别系统,能够通过迁移学习技术,将已训练的模型应用到新的模型训练中,以较少的数据量训练出高效的机器学习模型。微软也推出了基于私有数据的Azure OpenAI 功能,它技术借助算法让电脑对大量流动数据集...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...上,考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...官方放出的报告中,也只有非常简短的一句话提到了模型训练:通过强化学习,o1学会了磨练其思维链CoT并改进策略」不过业内惊奇地发现:OpenAI o1的思维链模式,竟然和360的「慢思考」理念不谋而合了?而且这一次,国内公司...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...每秒670亿亿次浮点运算),中心从投产即开始承接大模型训练任务,入选我国“2023年度央企十大超级工程”。大模型爆发为智算服务带来巨大的机遇和挑战,通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛,...……更多
该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击,对此,字节跳动10月19日回应表示,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为且已被辞退,但相关报道也存在部分夸大及失实信息...……更多
春节流量给支付宝留下了什么?
...资源的高效管理和调度,支付宝能够更快地完成AI模型的训练过程,使得AI模型能够更快地迭代更新,从而更好地支持AI在支付宝各业务线的应用。同时,在处理大规模数据时,异构计算技术的应用也显著提高了数据处理的速度和...……更多
apollo开放平台9.0全面升级
...觉上采用了YoloX+Yolo3D模型,对这两个模型灌入百万级数据训练,召回率和精准率号称都有“大幅提升”。Apollo开放平台9.0还提供了增量训练,支持独立自主完成模型训练,可在维持模型原有检测能力的前提下,提升特殊目标和特...……更多
支付宝在AI大模型时代
...术团队就在关注这个领域。2023年11月,蚂蚁集团技术团队训练的蚂蚁百灵大模型通过了备案。蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,但人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使 AI 系统被视为真正的开源系统,它必须提供:可访问用于训练 AI 的数据的详细信息,以便其他人可以理解和重新创建; 用于构建和运行 AI 的完整...……更多
马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
...amazing刷屏了。所以,这个开源机器人,究竟如何而来?训练只用2个小时完成这些动作的,是花粉机器人公司最新的机器人Reachy2。不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。该阶段中,开...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...目便开源了。LLaMA版o1最新进展目前已开源内容包括:预训练数据集、 预训练模型、强化学习训练代码。OpenLongCoT-Pretrain数据集,包含10万+条长思维链数据。每条数据包含一个完整的数学问题推理过程,包含思考内容和评分结果...……更多
本周(4.8-4.14)AI界发生了什么?
...发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,且成本更低,但英特尔并未与英伟达最新的 Blackwell 系列产品进行对比。谷歌发布Transformer新架构,解决大模型...……更多
加速落地 京东云大模型已支持数百个场景
...利用。在模型服务方面,平台提供从模型数据准备、模型训练与微调,到部署、评测的全生命周期服务,支持万卡级别的分布式训练,实现动态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...更多 OpenAI 的开放部分’。回到模型本身,Grok-1 从头开始训练,并且没有针对任何特定应用(如对话)进行微调。相对的,在 X(原 Twitter)上可用的 Grok 大模型是微调过的版本,其行为和原始权重版本并不相同。 Grok-1 的模型...……更多
她给跑马输入了什么代码?
...,它既考验体能,也需要识图能力。也正是在定向越野的训练中,我逐渐爱上了长跑。利用工作闲暇跑步早期都是凭感觉练记者:第一次参加马拉松赛是什么时候?早期跑马成绩如何?做了哪些备赛训练?黄雪梅:说来也巧,2015年...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...型提供动力,前不久刚刚升级到 4.0 Turbo 版本。通过更大训练数据体量、更优数据分布与质量、更强训练算法,文心大模型在理解、逻辑推理层面再次跃升。可以说,更强大文心大模型为文心快码的又一次「变身」提供了理论上...……更多
字节跳动大模型训练被实习生攻击 背后内幕曝光:四点真相
快科技10月19日消息,今日,字节跳动大模型训练遭实习生攻击一事引发广泛关注,相关话题随即登上热搜。据“大厂青年”爆料,据内部厂友透露,破坏模型训练确有其事,但传闻也有些夸张和虚构的信息。据了解,事情发生...……更多
稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来
...到了这一天,灵犀 X1 全套图纸、开发指南、推理代码、训练代码等就这么水灵灵的上线了。开发指南链接:https://www.zhiyuan-robot.com/DOCS/OS/X1-PDG 结构设计资料百度云盘:https://pan.baidu.com/s/1UEdeDBTJiXRmIqMK……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的应用入口。智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...流的个性化精品数字人通常属于在单个目标人数据上从头训练的小模型,虽然这种小模型能够有效地学到说话人的外表和说话风格,这种做法存在低训练效率、低样本效率、低鲁棒性的问题。相比之下,近年来许多工作专注于单...……更多
百度智能云晒大模型落地成绩单:5个第一!
...体服务。此次发布,百舸4.0在集群创建、开发实验、模型训练、模型推理等方面均进行升级,覆盖企业使用大模型的全流程,在诸多企业用户重点关心的指标上带来大幅提升。具体升级内容可参考:其次来看大模型平台千帆,它...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...果。真实数据稀缺可能不再是问题了,Nemotron 9T token的预训练预料中,98%都是合成数据。也许你还对合成数据存在顾虑,或者不知道如何应用LLM驱动数据生成。或许,英伟达的这篇博客可以提供答案。原文地址:https://developer.nvid...……更多
更多关于军事的资讯:
【多彩新论】持续夯实和平之基
近年来,我国国防预算稳步增长,今年达到1.78万亿元人民币,较去年增长7.2%。长期以来,我国军费占GDP比重始终保持在1
2025-03-11 21:49:00
苏联历史最惨痛一页:事后高压水枪冲洗血迹,急忙掩埋遇难者遗体
1962年6月,苏联新切尔卡斯克市的一场工人罢工演变为血腥压制,成为苏联官方长期掩盖的“禁忌”。这场事件中,工人因物价飞涨与工资缩水走上街头
2025-03-11 17:55:00
比俄罗斯A-100还大?朝鲜大型预警机基本成型,像极了空警-2000?
【军武次位面】作者:乐乐根据西方商业卫星拍摄的最新图片,一年多前就被发现的朝鲜大型预警机,硬件部分已基本成型。其构型并不是类似俄制A-50的简易模式
2025-03-11 17:59:00
俄罗斯“可怕的监狱”,不管多凶残的犯人,来了都得乖成猫
在俄罗斯广袤的国土上,有一座让连环杀手、食人魔甚至恐怖分子都闻风丧胆的监狱。这里没有死刑,却比死亡更可怕;这里没有刑具
2025-03-11 18:32:00
与歼20同款?枭龙战机的“苍蝇盔”,比F22用的还要好
巴基斯坦空军参加“胜利之矛军演”的枭龙Block3战机飞行员配套了头盔显示器(军迷称其为“苍蝇盔”),此种装备可以帮助空空导弹实现大离轴快速锁定
2025-03-11 11:35:00
俄称击退对莫斯科的大规模无人机袭击
被击落的无人机 资料图财联社3月11日电,俄罗斯莫斯科市市长索比亚宁当地时间11日称,俄防空部队击退了对莫斯科的大规模无人机袭击
2025-03-11 13:51:00
俄罗斯国防部通报称,自当地时间11日凌晨起,俄军防空系统共击落337架无人机,其中莫斯科州91架、库尔斯克州126架、布良斯克州38架
2025-03-11 13:53:00
来源:玉渊谭天00:31当地时间3月9日,中伊俄“安全纽带-2025”联合演习拉开帷幕,与前两年选择在阿曼湾附近海域演习不同,今年的演习范围更加具体,一起来看看现场情况。
2025-03-11 14:20:00
东南网3月11日讯 2025年3月17至23日,2025三明·闯世界火场生存挑战赛即将在三明沙县现代化实战消防综合训练基地火热开赛
2025-03-11 14:25:00
缅甸仰曼旧公路上的军方部队防卫哨所遭袭,5人死亡!武器被收缴
缅甸勃固省东吁县仰光-曼德勒旧公路上的一个军方部队防卫哨所遭到袭击并被清除。据革命消息来源向媒体透露,军方部队有5人死亡
2025-03-11 16:21:00
缅甸皎漂战事持续激烈!军方海陆空三军抵抗
自2月20日开始,缅甸若开邦皎漂镇军方Dhanyawadi海军总部附近村庄,军方部队与若开军(AA)之间的战事持续激烈
2025-03-11 16:23:00
055编队即将抵达珀斯港,美国的核潜艇会成为拦路虎吗
中国的055导弹驱逐舰编队即将抵达澳大利亚珀斯港,而美国的弗吉尼亚级攻击核潜艇“明尼苏达号”也刚刚进驻了附近的斯特林海军基地
2025-03-10 21:11:00
胶州刘奇:“灭火队长”的山林情怀
鲁网3月10日讯(记者 孙强 通讯员 李珂)“我做消防员已经16年了,参与过大大小小灭火救援1200次,每一次任务都是一场生死考验
2025-03-10 16:30:00
省地矿局物化探院:铸造海洋物探尖兵 助力“国家重点研发计划”
鲁网3月10日讯在山东莱州湾东部海域,寒冬季节并未阻挡山东省物化探勘查院滨海金矿陆海一体重磁电探测项目的稳步推进。该项目作为物化探院首次承担的国家重点研发计划专题
2025-03-10 16:31:00
国家海洋综合试验场(深海)共享航次首期行动圆满收官
南海网3月10日消息(记者 叶长文 通讯员 黄宏斌)近日,国家海洋综合试验场(深海)共享航次第一期行动顺利结束。此次行动由海南省海洋厅
2025-03-10 17:52:00