• 我的订阅
  • 头条热搜
每天训练12小时,敲出更有美感的代码
...法国里昂世赛“入场券”——每天训练12小时,敲出更有美感的代码第二届全国职业技能大赛网站技术项目金牌得主庞泽锐。 本报记者 邢千里摄 ■本报记者 占悦深夜的上海信息技术学校,靠近校门的两层小楼亮着灯,键...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...网友询问到,有没有可能 o1 就着你自己的代码,完成的训练?Kabasares 认为,o1 输出的 200 行代码,与自己 1100 行代码有着很大的不同,这是论文代码「最简版本」。深夜测试,o1 挑战大学、博士物理题为此,Kabasares 又发了第二...……更多
学会和软件代码“交朋友”(工匠绝活)
...件测试“绝活”的时候。这需要通过大量的实际案例进行训练。“在训练过程中要编写大量的自动化测试脚本,覆盖各种常见的测试场景。”叶重涵说,在这个过程中,他需要不断优化代码结构,提高脚本的可维护性和执行效率...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...兽,智谱AI在CNCC无疑充满了存在感。在智谱AI主办的“预训练大模型的挑战与未来”论坛开始前半小时,能容纳500多人的报告厅就几乎坐满了观众。△在CNCC,智谱AI CEO张鹏发布新一代模型在论坛上,智谱AI发布了新一代的中英双...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
码农真的危了!最近有消息称,OpenAI已经在悄悄地训练ChatGPT,让它学习人类的思考过程,从而真正掌握软件工程,彻底代替「初级码农」。OpenAI招外包大军,教AI学人类思考会编程的AI,几家硅谷大厂都在做。DeepMind的AlphaCode,...……更多
...了旷视AIS算法生产平台、边缘计算智能分析盒,以及算法训练服务,旨在降低算法生产门槛和成本,使企业能够轻松自主训练所需场景的算法,并将其快速部署到边缘智能分析盒中,实现算法与现实世界的深度融合。此外,旷视...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率的同时提升大模型处理复杂任务的性能,更快地学习复杂任务的同时保证准确性。与稠密模型相比,MoE模型的预训练速度更快;使用MoE 层代替transformer 中的...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...一种自定义图像识别系统,能够通过迁移学习技术,将已训练的模型应用到新的模型训练中,以较少的数据量训练出高效的机器学习模型。微软也推出了基于私有数据的Azure OpenAI 功能,它技术借助算法让电脑对大量流动数据集...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...上,考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...复博士带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...官方放出的报告中,也只有非常简短的一句话提到了模型训练:通过强化学习,o1学会了磨练其思维链CoT并改进策略」不过业内惊奇地发现:OpenAI o1的思维链模式,竟然和360的「慢思考」理念不谋而合了?而且这一次,国内公司...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...每秒670亿亿次浮点运算),中心从投产即开始承接大模型训练任务,入选我国“2023年度央企十大超级工程”。大模型爆发为智算服务带来巨大的机遇和挑战,通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛,...……更多
该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击,对此,字节跳动10月19日回应表示,经公司内部核实,确有商业化技术团队实习生发生严重违纪行为且已被辞退,但相关报道也存在部分夸大及失实信息...……更多
apollo开放平台9.0全面升级
...觉上采用了YoloX+Yolo3D模型,对这两个模型灌入百万级数据训练,召回率和精准率号称都有“大幅提升”。Apollo开放平台9.0还提供了增量训练,支持独立自主完成模型训练,可在维持模型原有检测能力的前提下,提升特殊目标和特...……更多
春节流量给支付宝留下了什么?
...资源的高效管理和调度,支付宝能够更快地完成AI模型的训练过程,使得AI模型能够更快地迭代更新,从而更好地支持AI在支付宝各业务线的应用。同时,在处理大规模数据时,异构计算技术的应用也显著提高了数据处理的速度和...……更多
支付宝在AI大模型时代
...术团队就在关注这个领域。2023年11月,蚂蚁集团技术团队训练的蚂蚁百灵大模型通过了备案。蚂蚁大模型坚持自主研发、全栈布局,目前已形成包括大模型底层基础设施、基础大模型、行业大模型、应用产品在内的完整技术链条...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,但人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使 AI 系统被视为真正的开源系统,它必须提供:可访问用于训练 AI 的数据的详细信息,以便其他人可以理解和重新创建; 用于构建和运行 AI 的完整...……更多
马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
...amazing刷屏了。所以,这个开源机器人,究竟如何而来?训练只用2个小时完成这些动作的,是花粉机器人公司最新的机器人Reachy2。不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。该阶段中,开...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...目便开源了。LLaMA版o1最新进展目前已开源内容包括:预训练数据集、 预训练模型、强化学习训练代码。OpenLongCoT-Pretrain数据集,包含10万+条长思维链数据。每条数据包含一个完整的数学问题推理过程,包含思考内容和评分结果...……更多
本周(4.8-4.14)AI界发生了什么?
...发布新一代 Gaudi 3 AI 芯片。新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,且成本更低,但英特尔并未与英伟达最新的 Blackwell 系列产品进行对比。谷歌发布Transformer新架构,解决大模型...……更多
加速落地 京东云大模型已支持数百个场景
...利用。在模型服务方面,平台提供从模型数据准备、模型训练与微调,到部署、评测的全生命周期服务,支持万卡级别的分布式训练,实现动态资源统一管理。在智能体构建方面,平台提供一系列多模态组件与应用框架,如文生...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...更多 OpenAI 的开放部分’。回到模型本身,Grok-1 从头开始训练,并且没有针对任何特定应用(如对话)进行微调。相对的,在 X(原 Twitter)上可用的 Grok 大模型是微调过的版本,其行为和原始权重版本并不相同。 Grok-1 的模型...……更多
她给跑马输入了什么代码?
...,它既考验体能,也需要识图能力。也正是在定向越野的训练中,我逐渐爱上了长跑。利用工作闲暇跑步早期都是凭感觉练记者:第一次参加马拉松赛是什么时候?早期跑马成绩如何?做了哪些备赛训练?黄雪梅:说来也巧,2015年...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...型提供动力,前不久刚刚升级到 4.0 Turbo 版本。通过更大训练数据体量、更优数据分布与质量、更强训练算法,文心大模型在理解、逻辑推理层面再次跃升。可以说,更强大文心大模型为文心快码的又一次「变身」提供了理论上...……更多
字节跳动大模型训练被实习生攻击 背后内幕曝光:四点真相
快科技10月19日消息,今日,字节跳动大模型训练遭实习生攻击一事引发广泛关注,相关话题随即登上热搜。据“大厂青年”爆料,据内部厂友透露,破坏模型训练确有其事,但传闻也有些夸张和虚构的信息。据了解,事情发生...……更多
稚晖君来填坑:开源灵犀X1全套图纸+代码,复刻搞起来
...到了这一天,灵犀 X1 全套图纸、开发指南、推理代码、训练代码等就这么水灵灵的上线了。开发指南链接:https://www.zhiyuan-robot.com/DOCS/OS/X1-PDG 结构设计资料百度云盘:https://pan.baidu.com/s/1UEdeDBTJiXRmIqMK……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...之一,也是体现通用大模型能力的试金石,对模型算法、训练平台、算力设施都有较高的要求。在用户侧,这又是一个和广大用户联系紧密的应用入口。智能涌现尝试用简单的指令让混元画图,生成速度基本在10秒左右,效果可...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...流的个性化精品数字人通常属于在单个目标人数据上从头训练的小模型,虽然这种小模型能够有效地学到说话人的外表和说话风格,这种做法存在低训练效率、低样本效率、低鲁棒性的问题。相比之下,近年来许多工作专注于单...……更多
百度智能云晒大模型落地成绩单:5个第一!
...体服务。此次发布,百舸4.0在集群创建、开发实验、模型训练、模型推理等方面均进行升级,覆盖企业使用大模型的全流程,在诸多企业用户重点关心的指标上带来大幅提升。具体升级内容可参考:其次来看大模型平台千帆,它...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...果。真实数据稀缺可能不再是问题了,Nemotron 9T token的预训练预料中,98%都是合成数据。也许你还对合成数据存在顾虑,或者不知道如何应用LLM驱动数据生成。或许,英伟达的这篇博客可以提供答案。原文地址:https://developer.nvid...……更多
更多关于军事的资讯:
来源:新华社当地时间9日,伊朗总统佩泽希齐扬在国家核技术日上发表讲话。佩泽希齐扬表示,伊朗在核技术上取得很多成就,在设备供应
2025-04-09 21:52:00
央视消息 “要打奉陪到底!”台学者看到中方对美强硬表态,眼泪差点夺眶而出。
2025-04-09 22:49:00
中国网4月9日讯 据“国防部发布”微信公众号消息,4月9日下午,国防部新闻发言人张晓刚大校就近期涉军问题发布消息。记者
2025-04-09 16:58:00
智合新材重大突破,低成本耐高温透波力学承载一体化雷达天线罩量产
在高端制造领域,材料科学的每一次突破都可能引发产业格局的重塑。近日,智合(深圳)新材科技有限公司发布消息称,其低成本/耐高温/透波/承载多功能一体化天线罩量产
2025-04-09 17:14:00
李在明辞去党首竞选韩国总统,祝愿他心想事成
新华社首尔4月9日电:据韩联社9日报道,韩国最大在野党共同民主党党首李在明当天辞去党首一职,这被视为其正式准备参加新一届总统选举
2025-04-09 17:16:00
大众网记者 张勇 刘涛 周琛 路鑫 菏泽报道
2025-04-09 17:27:00
美军全球大调兵,暴露出“三强三弱”
中新网4月9日电(钟新军)近日,为打击也门胡塞武装并威慑伊朗,美国从世界各地调兵遣将。在此过程中,美军诸多优缺点展露无遗
2025-04-09 13:16:00
国防部:中国军队愿与印方共同维护好边境地区和平安宁
中新网4月9日电 据“国防部发布”微信公众号消息,4月9日下午,国防部新闻发言人张晓刚大校就近期涉军问题发布消息。图自“国防部发布”微信公众号记者
2025-04-09 15:16:00
中新网4月9日电 据国防部网站消息,4月9日下午,国防部新闻发言人张晓刚大校就近期涉军问题发布消息。应巴基斯坦军队邀请
2025-04-09 15:46:00
中新网北京4月9日电 (记者 谢雁冰 李京泽)中国外交部发言人林剑4月9日主持例行记者会。有记者提问:据报道,日本政府4月8日发布2025年版《外交蓝皮书》
2025-04-09 15:46:00
中新网4月9日电 据国防部网站消息,4月9日下午,国防部新闻发言人张晓刚大校就近期涉军问题发布消息。4月至8月,第二届全军军事翻译挑战赛将在国防科技大学外国语学院举行
2025-04-09 15:46:00
编导:张晶摄像:王木者、张晶剪辑:王木者、张晶
2025-04-09 09:20:00
叙利亚过渡政府召开会议 关注战后重建工作
当地时间7日,叙利亚过渡政府召开会议。叙利亚政权领导人艾哈迈德·沙拉主持此次会议。沙拉在讲话中强调,过渡政府将高度重视战后基础设施重建和恢复经济和金融秩序
2025-04-09 07:20:00
苏联的“空中战列舰”有多牛?装7台发动机,全身大炮武装到牙齿
1933年的深秋苏联某试飞场,一架翼展超过53米的庞然大物,在七台发动机的轰鸣中缓缓升空。驾驶舱里的加里宁紧握操纵杆,额头渗出冷汗——这架被他称为“空中战列舰”的K7轰炸机
2025-04-08 13:30:00
史上最狂国家!扬言3天灭苏联,1天横扫欧洲,1天踏平美国
在非洲西海岸,有一个形如蚯蚓般狭长的国家——冈比亚。它被塞内加尔三面包围,国土面积仅1.1万平方公里(跟我们青岛差不多大)
2025-04-08 13:45:00