• 我的订阅
  • 头条热搜
每天训练12小时,敲出更有美感的代码
...法国里昂世赛“入场券”——每天训练12小时,敲出更有美感的代码第二届全国职业技能大赛网站技术项目金牌得主庞泽锐。 本报记者 邢千里摄 ■本报记者 占悦深夜的上海信息技术学校,靠近校门的两层小楼亮着灯,键...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友询问到,有没有可能 o1 就着你自己的代码,完成的训练?Kabasares 认为,o1 输出的 200 行代码,与自己 1100 行代码有着很大的不同,这是论文代码「最简版本」。深夜测试,o1 挑战大学、博士物理题为此,Kabasares 又发了第二...……更多
学会和软件代码“交朋友”(工匠绝活)
...件测试“绝活”的时候。这需要通过大量的实际案例进行训练。“在训练过程中要编写大量的自动化测试脚本,覆盖各种常见的测试场景。”叶重涵说,在这个过程中,他需要不断优化代码结构,提高脚本的可维护性和执行效率...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。△在CNCC,智谱AI CEO张鹏发布新一代模型在论坛上,智谱AI发布了新一代的中英双...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
码农真的危了!最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。OpenAI招外包大军,教AI学人类思考会编程的AI,几家硅谷大厂都在做。DeepMind的AlphaCode,...……更多
...了旷视AIS算法生产平台、边缘计算智能分析盒,以及算法训练服务,旨在降低算法生产门槛和成本,使企业能够轻松自主训练所需场景的算法,并将其快速部署到边缘智能分析盒中,实现算法与现实世界的深度融合。此外,旷视...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率的同时提升大模型处理复杂任务的性能,更快地学习复杂任务的同时保证准确性。与稠密模型相比,MoE模型的预训练速度更快;使用MoE 层代替transformer 中的...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...一种自定义图像识别系统,能够通过迁移学习技术,将已训练的模型应用到新的模型训练中,以较少的数据量训练出高效的机器学习模型。微软也推出了基于私有数据的Azure OpenAI 功能,它技术借助算法让电脑对大量流动数据集...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...上,考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...官方放出的报告中,也只有非常简短的一句话提到了模型训练:通过强化学习,o1学会了磨练其思维链CoT并改进策略」不过业内惊奇地发现:OpenAI o1的思维链模式,竟然和360的「慢思考」理念不谋而合了?而且这一次,国内公司...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...每秒670亿亿次浮点运算),中心从投产即开始承接大模型训练任务,入选我国“2023年度央企十大超级工程”。大模型爆发为智算服务带来巨大的机遇和挑战,通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛,...……更多
该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击,对此,字节跳动10月19日回应表示,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为且已被辞退,但相关报道也存在部分夸大及失实信息...……更多
春节流量给支付宝留下了什么?
...资源的高效管理和调度,支付宝能够更快地完成AI模型的训练过程,使得AI模型能够更快地迭代更新,从而更好地支持AI在支付宝各业务线的应用。同时,在处理大规模数据时,异构计算技术的应用也显著提高了数据处理的速度和...……更多
apollo开放平台9.0全面升级
...觉上采用了YoloX+Yolo3D模型,对这两个模型灌入百万级数据训练,召回率和精准率号称都有“大幅提升”。Apollo开放平台9.0还提供了增量训练,支持独立自主完成模型训练,可在维持模型原有检测能力的前提下,提升特殊目标和特...……更多
支付宝在AI大模型时代
...术团队就在关注这个领域。2023年11月,蚂蚁集团技术团队训练的蚂蚁百灵大模型通过了备案。蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,但人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使 AI 系统被视为真正的开源系统,它必须提供:可访问用于训练 AI 的数据的详细信息,以便其他人可以理解和重新创建; 用于构建和运行 AI 的完整...……更多
马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
...amazing刷屏了。所以,这个开源机器人,究竟如何而来?训练只用2个小时完成这些动作的,是花粉机器人公司最新的机器人Reachy2。不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。该阶段中,开...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...目便开源了。LLaMA版o1最新进展目前已开源内容包括:预训练数据集、 预训练模型、强化学习训练代码。OpenLongCoT-Pretrain数据集,包含10万+条长思维链数据。每条数据包含一个完整的数学问题推理过程,包含思考内容和评分结果...……更多
本周(4.8-4.14)AI界发生了什么?
...发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,且成本更低,但英特尔并未与英伟达最新的 Blackwell 系列产品进行对比。谷歌发布Transformer新架构,解决大模型...……更多
加速落地 京东云大模型已支持数百个场景
...利用。在模型服务方面,平台提供从模型数据准备、模型训练与微调,到部署、评测的全生命周期服务,支持万卡级别的分布式训练,实现动态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...更多 OpenAI 的开放部分’。回到模型本身,Grok-1 从头开始训练,并且没有针对任何特定应用(如对话)进行微调。相对的,在 X(原 Twitter)上可用的 Grok 大模型是微调过的版本,其行为和原始权重版本并不相同。 Grok-1 的模型...……更多
她给跑马输入了什么代码?
...,它既考验体能,也需要识图能力。也正是在定向越野的训练中,我逐渐爱上了长跑。利用工作闲暇跑步早期都是凭感觉练记者:第一次参加马拉松赛是什么时候?早期跑马成绩如何?做了哪些备赛训练?黄雪梅:说来也巧,2015年...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...型提供动力,前不久刚刚升级到 4.0 Turbo 版本。通过更大训练数据体量、更优数据分布与质量、更强训练算法,文心大模型在理解、逻辑推理层面再次跃升。可以说,更强大文心大模型为文心快码的又一次「变身」提供了理论上...……更多
稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来
...到了这一天,灵犀 X1 全套图纸、开发指南、推理代码、训练代码等就这么水灵灵的上线了。开发指南链接:https://www.zhiyuan-robot.com/DOCS/OS/X1-PDG 结构设计资料百度云盘:https://pan.baidu.com/s/1UEdeDBTJiXRmIqMK……更多
字节跳动大模型训练被实习生攻击 背后内幕曝光:四点真相
快科技10月19日消息,今日,字节跳动大模型训练遭实习生攻击一事引发广泛关注,相关话题随即登上热搜。据“大厂青年”爆料,据内部厂友透露,破坏模型训练确有其事,但传闻也有些夸张和虚构的信息。据了解,事情发生...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的应用入口。智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可...……更多
百度智能云晒大模型落地成绩单:5个第一!
...体服务。此次发布,百舸4.0在集群创建、开发实验、模型训练、模型推理等方面均进行升级,覆盖企业使用大模型的全流程,在诸多企业用户重点关心的指标上带来大幅提升。具体升级内容可参考:其次来看大模型平台千帆,它...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...流的个性化精品数字人通常属于在单个目标人数据上从头训练的小模型,虽然这种小模型能够有效地学到说话人的外表和说话风格,这种做法存在低训练效率、低样本效率、低鲁棒性的问题。相比之下,近年来许多工作专注于单...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...果。真实数据稀缺可能不再是问题了,Nemotron 9T token的预训练预料中,98%都是合成数据。也许你还对合成数据存在顾虑,或者不知道如何应用LLM驱动数据生成。或许,英伟达的这篇博客可以提供答案。原文地址:https://developer.nvid...……更多
更多关于军事的资讯:
中国空军新一代作战平台首飞已经一个星期了,随着出来的视频越来越多,关于这架飞机的一些细节也在逐渐明晰,很多东西也就可以拿出来稍微说一说了
2025-01-01 20:28:00
都“六代机”了,讲讲如何手搓飞机,预警:此文不适合大多数人!
昨天有人问W君自己的专业学什么的,就好像W君的专业不能聊飞机一样。W君是做“穿天猴”的。咱们就以做“穿天猴”的专业视角来聊聊怎么手搓六代机
2025-01-01 21:05:00
C919沪港首航机舱里传来了新年祝福!
2025年1月1日国产大飞机C919“沪港航线”首航航班飞抵香港国产大飞机在地区航线上执飞定期商业航班的新航程也由此开启本次航班总台主持人康辉的声音在东航客舱响起“您所乘坐的C9
2025-01-01 21:30:00
2024年12月31日早上,中国南方航空CZ5509航班从广州白云国际机场顺利起飞,前往文莱首都斯里巴加湾市。这是C909飞机(原ARJ21)首次执飞广州-文莱航线
2025-01-01 18:28:00
俄出口中心:2024年前11个月俄罗斯对华出口总额增至1180亿美元
【俄罗斯出口中心副总裁阿列克谢·索洛多夫在接受卫星通讯社采访时表示,2024年前11个月,俄罗斯对华出口总额增至1180亿美元
2025-01-01 19:26:00
新一代战斗机的定义权属于中国,美国媒体无奈只能开始找补
在被中国的最新战机震撼之后,美国媒体开始找补起来,他们说新试飞的只不过是个空壳子,殊不知,新一代战斗机最牛的地方就在这里
2025-01-01 19:30:00
小米领跑俄罗斯手机市场
【俄罗斯移动运营商MTS分析师为卫星通讯社计算,今年1月至10月,俄罗斯消费者购买最多的手机品牌是中国小米,该品牌占销售总量的五分之一
2025-01-01 19:38:00
日本“工匠”又少了一个,极右翼想复兴军工,可军工带头造假
这几年,公知们吹捧的日本“工匠精神”,在互联网的高信息流通下,纷纷爆雷,一定程度上颠覆了人们的认知。有些日本企业更是数以几十万计的产品数据造假
2025-01-01 13:16:00
俄防长视察黑海舰队海军陆战队训练情况
俄罗斯国防部2024年12月31日发布消息称,俄罗斯国防部长别洛乌索夫在俄罗斯南方军区一个训练场视察了俄黑海舰队海军陆战队的训练情况
2025-01-01 15:49:00
家门岂容挑衅!美军航母不请自来,解放军亮剑南海,结局大快人心
美军航母不请自来,解放军果断亮剑南海,这释放了何种信号?大快人心的结局又说明了什么道理?南海这片广阔的海域,向来都是国际政治的热点
2025-01-01 12:33:00
1月1日上午8时21分,中国东方航空使用C919执飞MU721“上海虹桥—香港”航班,搭载157名旅客从上海虹桥国际机场起飞
2025-01-01 08:56:00
元旦前夕 欢迎新战友回家
官兵夹道欢迎新战友入营多彩贵州网讯(通讯员 熊成龙 侯鲁晋 本网记者 秦丽)近日,武警贵州总队黔西南支队举行2024年迎新仪式
2025-01-01 00:09:00
我国海军新机型亮相,相加比高更可靠赢得多国喜爱,27国争相购买
“本文章已经通过区块链技术进行版权认证,禁止任何形式的改编转载抄袭,违者追究法律责任”虽然目前世界上的战争已然减少,人们生活的环境也相对太平
2024-12-31 17:12:00
中国原创+中国制造,林柄洋打开“立体”的童书世界。
2024-12-31 21:27:00
北部战区空军某旅深化空地协同对抗训练——这一年,体系练兵纵深推进隆冬时节,北部战区空军某旅训练场导弹昂首、雷达耸立,一场空地协同对抗训练激战正酣
2024-12-31 14:53:00