新发,模型,团队,代码,模型,团队头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

国内团队新发大模型：ceo上阵写代码

国内自研大模型迎来新面孔，而且发布即开源！最新消息，多模态大语言模型TigerBot正式亮相，包含70亿参数和1800亿参数两个版本，均对外开源。由该模型支持的对话AI同步上线。写广告语、做表格、纠正语法错误，效果都不错...……更多

2023-06-07 21:01:00新发,模型,团队,代码,模型,团队

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

字节开源全栈AI编程基准，不小心曝光豆包代码大模型

豆包代码大模型，不小心给曝光了！在字节开源的代码大模型评估基准FullStack Bench里面，出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版，还并没有上线。它在多种编程语言上的性能表现如下，可以看到在闭源模...……更多

2024-12-06 09:50:00豆包,基准,字节,模型,编程,代码

杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特...……更多

2025-05-28 14:17:00模型,团队,参数,能力,数学,代码

错例都一样！斯坦福学生团队致歉抄袭中国大模型：已撤回代码作

美国斯坦福大学的一个AI（人工智能）团队就抄袭中国大模型致歉。近日，由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V。但是，该模型很快被曝出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有...……更多

2024-06-04 22:12:00斯坦,斯坦福,中国,模型,抄袭,团队

斯坦福AI团队抄袭国产大模型？连识别“清华简”都抄了！清华系

智东西6月3日消息，大模型“套壳”的回旋镖，这次扎到了美国科研团队身上。最近几天，斯坦福大学AI团队陷入抄袭风波，被质疑“套壳”清华系大模型开源成果，引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大...……更多

2024-06-04 14:35:00清华,斯坦,斯坦福,团队,模型,抄袭

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...此，研究团队使用进化生物学的方法，把esmGFP当成自然界新发现的蛋白质进行分析。他们估计，esmGFP等效于进化模拟器执行的超过 5 亿年的自然进化。esmGFP的渲染图开放模型自成立以来，ESM项目（ESM project）一直致力于通过发布...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

如何跑赢生成式AI竞赛？云计算大厂揭秘组合拳：自研大模型只是

...值。一、大模型货架上新：不会厚此薄彼，提供试用机会新发布的Nova基础模型包括Micro、Lite、Pro、Premier模型，Micro是纯文本模型，后三者都是多模态模型，还有文生图模型Canvas和文生视频模型Reel。这些模型都支持微调和蒸馏，...……更多

2024-12-16 09:15:00大厂,组合拳,竞赛,生成,模型,只是

最强AI程序员砸饭碗：84秒跑通代码像人一样思考

...了30.07%问题的成绩夺得榜首。（SWE-Bench是一个用来评估大模型解决现实中软件问题的基准。）而这个成绩可谓是遥遥领先第二名19.27%，解锁了提升SOTA的最大增幅——57%！至于Genie的实际效果，用团队的话来说就是：它可以做到像...……更多

2024-08-13 14:46:00程序员,代码,程序,数据,模型,团队

36氪首发｜聚焦AIGC for Code，「硅心科技aiX

...的A轮融资。上轮融资后，硅心科技一方面加快了代码大模型的研发进程；另一方面开始推进模型落地应用，面向金融、互联网等重点行业的头部客户提供模型个性化训练和私有化部署服务。2022年，硅心科技发布了国内首个基于...……更多

2023-09-01 14:57:00落地,融资,行业,科技,代码,模型

大模型训练被实习生攻击？字节跳动回应：已辞退

该实习生已在8月被辞退。近日有传闻称字节跳动大模型训练被实习生攻击，对此，字节跳动10月19日回应表示，经公司内部核实，确有商业化技术团队实习生发生严重违纪行为且已被辞退，但相关报道也存在部分夸大及失实信息...……更多

2024-10-19 21:50:00实习生,字节,模型,实习,攻击,训练

1行代码改进大模型训练，Llama训练速度升至1.47倍，华

只要改一行代码，就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者，提出了大模型训练优化器Cautious Optimizers。在提速的同时，Cautious能够保证训练效果不出现损失，而且语言和视觉模型都适用。...……更多

2024-11-28 09:58:00训练,模型,团队,速度,代码,华人

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

「虎博科技」发布自研多模态大模型TigerBot，开源模型、

...勋36氪获悉，6月7日，虎博科技正式发布并开源其自研大模型TigerBot。同时，虎博科技还发布了大模型应用开发所需的全套API，以及多领域专业数据。虎博科技成立于2017年，是一家专注于深度学习及NLP（自然语言处理）技术的AI公...……更多

2023-06-07 13:04:00模型,模态,代码,数据,科技,模型

只接受用户指令 GPT-4自我纠错能力新发现

7月5日，麻省理工学院和微软的研究学者们发现，人工智能（AI）模型GPT-4具有卓越的代码自我纠错能力，而GPT-3.5不具备这种特性。目前相关论文已经在相关学术平台进行发布。当前市场上涌现了一批为编写代码而研发的AI模型...……更多

2023-07-08 05:56:00新发,指令,能力,用户,代码,模型

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...成的”，薛娇总会带着这种必胜的信念，一往无前。从大模型重要技术突破到行业应用方案制定，从技术先锋到团队领导者，正是这种将浪漫理想转化为技术现实的独特能力，让她在云计算领域树立起巾帼标杆。当被问及成功秘...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

抢跑大模型应用大战，从这场黑客松开始

首届我爱黑“可颂”大语言模型应用创新挑战赛来了！百模大战进入第二幕，应用落地成为竞跑新“赛点”，业内对接下来随时可能出现的颠覆性应用投注了热切的目光。区别于对底层技术能力的强调，大模型应用阶段的较量...……更多

2023-10-23 16:38:00黑客,模型,大战,应用,应用,模型

未来已来，大模型应用之战打响

首届我爱黑「可颂」大语言模型应用创新挑战赛圆满已经落幕，但大语言模型应用的竞跑，才刚刚开始。年末将近，如果要为2023年选出一个关键词，大语言模型无疑是绕不开的选项。百模大战进入第二幕，我们既兴奋又不安。...……更多

2023-11-10 15:11:00模型,应用,应用,模型,团队,语言

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比如官...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

复旦MOSS：模型还不成熟、只是想内测未来将开源代码

复旦MOSS：模型还不成熟、只是想内测未来将开源代码【复旦MOSS：模型还不成熟、只是想内测未来将开源代码】财联社2月21日电，复旦MOSS官网发布公告称，MOSS还是一个非常不成熟的模型，距离ChatGPT还有很长的路需要走。在MOS...……更多

2023-02-21 10:13:00复旦,模型,成熟,只是,代码,复旦

OpenAI竞争对手发布迄今为止最强大AI模型

... 3系列模型，而OpenAI则在5月推出了GPT-4o。据Anthropic透露，新发布的Claude 3.5 Sonnet在性能上超越了其前一代模型Claude 3 Opus，而后者则是Anthropic新推出的Claude 3.5系列中的首款模型。Claude 3.5 Sonnet现已免费……更多

2024-06-21 09:19:00迄今为止,模型,对手,竞争,模型,代伊

前实习生篡改代码攻击大模型训练字节跳动起诉要求赔偿800万

...洋）字节跳动起诉前实习生田柯宇篡改代码攻击公司内部模型训练一案，已获北京市海淀区人民法院正式受理。字节跳动请求法院，判令田柯宇赔偿公司侵权损失800万元及合理支出2万元，并公开赔礼道歉。11月5日，字节跳动曾...……更多

2024-11-28 12:31:00实习生,字节,模型,实习,攻击,训练

成本不到150元！26分钟训出个推理模型媲美o1和R1

...练s1所需的计算资源，在当下约花20美元就能租到。研究新发现：频繁抑制思考会导致死循环训出模型后，团队选用3个推理基准测试，把s1-32B和OpenAI o1系列、DeepSeek-R1系列、阿里通义Qwen2.5系列/QWQ、昆仑万维Sky系列、Gemini 2.0 Flash T...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理