• 我的订阅
  • 头条热搜
马斯克打脸OpenAI!全球最大模型Grok-1开源
...nAI“反击”称,“当创始团队讨论以营利为目的的结构以进一步实现使命时,马斯克希望我们与特斯拉合并,否则他想要完全控制。马斯克离开了OpenAI,表示需要有一个与Google/DeepMind相关的竞争对手,而他将自己做这件事。他说...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。武汉人工智能学院一位资深研究人员向《科创板日报》记...……更多
...召开的“AI赋能 产业焕新”中央企业人工智能专题推进会进一步强调了人工智能在推动产业发展中的重要作用,并明确指出中央企业要主动拥抱人工智能带来的深刻变革,将发展人工智能放在全局工作中统筹谋划。那么,国投智...……更多
张云泉:集中力量,促进国产AI大模型发展
...辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步渗透的关键因素。2024年8月21日,观众在北京世界机器人大会上参观(李欣/摄)以OpenAI ChatGPT为代表的通用人工智能的快速发展,预示着全球新一轮科技革命和产业变...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...预测,同时还不会显著影响输出的质量。基于这些观察和进一步的实验,云天励飞得到了一个结论:在图像生成方面,自回归(AR)方法并不比掩码式语言模型(MLM)差,甚至可能还更好一点。虽然在语言领域,AR 优于 MLM 已经...……更多
...究机构。这些应用产品是科技公司在开源大模型的基础上进一步开发完成的。金融机构更多的是采购科技公司提供的方案,也有一些探索是设计一些Agent用大模型来解决自己的研发能力的问题。高校等研究机构在做自己的开源模...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...推进MoE广泛应用至关重要,但可能会损害模型性能,需要进一步优化并行预训练和推理策略。MoE未来重点研究方向1.通过优化MoE架构、改进门控算法等,提高模型性能和稳定性。一是业界正在加快研发各种新型MoE架构,以提升模...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...复杂问题并验证输出内容,代表人类离通用人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...引用 / 定位训练。团队还进行了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。五大特点 全面超越昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测...……更多
LLM训练通信量减少10000倍!全新分布式优化器,整合世间算力训练强大AI
...则每个节点只需上传2.8MB数据(接收数据不变),通信量进一步减少。另外,不对称性是有优点的,因为大多数消费互联网的带宽严重偏向于更高的下载速度。假设稳定的网速为100Mbps下载和10Mbps上传,则最坏情况下的延迟仅为下...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...素。行使这些自由的先决条件是能够对系统进行修改。再进一步,对于机器学习系统可修改的形式,OSI 也进行了定义。必须包含以下所有元素:数据信息:用于训练系统的数据的足够详细的信息,以便技术人员可以构建基本等...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...。这为构建轨迹基础模型提供了充足且丰富的数据支持。进一步,研究团队设计并预训练了 UniTraj 这样一个通用的轨迹基础模型结构,并集成了多种重采样和掩码策略,能够有效支撑不同区域、任务和数据质量的需要。论文地址...……更多
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
...区驱动的方式同样可以实现。他们的下一步计划是将模型进一步扩展到前沿规模,最终目标是实现开源 AGI。这一点在其在线 Demo 的模型选项中已有暗示 —— 其中包含开放推理模型甚至 AGI 和 ASI 的潜在选项。看起来这确实是一...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...此外,方言语料库的稀缺以及高质量标注数据的匮乏,也进一步增加了技术难度。 巨人网络 AI Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中国方言体系,构建了涵盖 20...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...测,同时十亿参数量级的版本预计2024年8月完成预训练,进一步为新时代防震减灾事业现代化提供科技支撑。强强联手 发布全球第一个亿级参数量的地震波大模型成都数据集团党委副书记、超算运营公司董事长郭黎表示,2023年9...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...型能够教导机器人在全新的环境中完成基本任务,而无需进一步的训练或微调。研究团队训练了五个 RUMs,分别用于执行开门、开抽屉、拾取纸巾、拾取纸袋以及重新摆正圆柱形物体等任务。令人惊喜的是,这些模型在未知环境...……更多
中国智算建设潮背后,谁在推动十万卡集群
...总裁、百度智能云事业群总裁沈抖透露,为了支撑大模型进一步的高速发展,百度在打磨十万卡集群能力方面,已在两大问题上取得关键突破。与此同时,字节和阿里在智算上投入巨大,今年以来,华为也联合厂商在攻克更大规...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...题时,人们往往会错误地判定其无效。Google DeepMind的研究进一步揭示,大型语言模型也表现出类似的行为,在提示下能够表现出一致的逻辑推理,但也会受到“内容效应”的影响,即在处理与已有知识或信念相符的信息时,推理...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...计算和传输。同时在计算流程中实现了高效的算子融合,进一步提升模型的训练性能。 通信与计算重叠:由于MoE架构的专家之间需要大量通信,会影响整体计算效率。为此团队设计了“多维度的通信与计算重叠”机制,即在进...……更多
...坚持“稳中拓新”的基调,在稳固好基本盘的基础上,将进一步深化“文化和科技融合”,实现由内容制作公司向文化科技公司转型的高质量发展目标,在谋求转型中找到适合自己发展的“道路”。事实上,中广天择在运营音视...……更多
较传统采标方法降本80%,合成数据服务商「卓印智能」获天使轮融资 | 36氪首发
...性上具有独特的优越性,且随着AI技术的发展,优势将会进一步放大。目前,卓印智能选择先在场景复杂、数据需求大的领域切入市场,来完成早期的商业拓展,比如自动驾驶、工业等赛道。俞开文博士认为,比如在具身智能等...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...el as a Service);在算力层,MaaS依赖的新型IT基础设施也将进一步在底层颠覆现有的云计算市场格局。而百度云对模型服务的升级,也主要围绕大模型、智能计算、AI原生应用开发新范式三个层面。1、在大模型层面,围绕建设模型...……更多
马斯克偏心 xAI,被曝挖走十多名特斯拉人才训练 Grok AI 模型
... electrek 昨日(8 月 8 日)报道,埃隆・马斯克(Elon Musk)进一步向其 xAI 公司倾斜资源,目前已为其语言模型 Grok 聘请了十几名特斯拉员工,特斯拉公司股东因此提起诉讼。遭股东起诉马斯克在过去一段时间里,多次在公开场合...……更多
激活数据价值!贵州:构建数据流通新生态 培育数字产业竞争力
...通、数据资产投融,数据抵质押、担保、处置六大板块,进一步推动数据流通,产业升级和场景应用,为数据要素全国统一大市场打下坚实基础,全面推进数字经济的融通和发展。贵安华为云数据中心贵阳大数据交易所是全国第...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
作者|黄楠编辑|袁斯来大模型今天所展示出的强大能力,源于背后海量数据,为其注入了丰富的人类知识。如果将大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...作者提出,可以应用「专家迭代」(expert iteration)方法进一步提升性能。具体来说,从初始的Lean-CoT模型M0以及初始数据集D开始,让M0对每个问题进行K次采样,每次采样都会产生一个证明轨迹 [(s0,t0,a0),(s1,t1,a1),⋯,(sn,tn,an)],之后...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...性能下降的潜在可能。这一预测通过随后的模型性能评估进一步得到证实。因此,entropy law 可以作为 LLM 训练的指导原则,无需在完整数据集上训练模型直到收敛,便可预测 LLM 训练失败的潜在风险。鉴于训练 LLM 的高昂成本,这...……更多
...又将MDT版本升级,引入了一个更为高效的宏观网络结构,进一步优化了学习过程,同时通过采用更优的训练策略进一步加速模型的训练过程。实验结果证明,通过视觉表征学习增强对物理世界的语义理解,能够提升生成模型对物...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...准确率分数为 60.73、58.59 和 62.79。在 MMedC 语料库上进行进一步自回归训练后,也观察到性能的提升。具体来说,最终模型 MMed-Llama 3 与其基座模型 Llama 3 相比,表现出了显著的性能提升,在全量微调评估下,MMed-Llama 3(67.75)平...……更多
更多关于科技的资讯:
虎鲸文娱人才创作基地落户陵水,助力海归青年创作者“回家筑梦”
日前,第七届海南岛国际电影节“青椰计划”特别活动——虎鲸文娱集团旗下大麦娱乐“海纳圆桌对谈”在三亚举行。虎鲸文娱集团正式宣布
2025-12-08 13:54:00
平台默认勾选开启、强制关联支付软件、开通容易取消难……网络上,有关免密支付的“吐槽”层出不穷,反映出消费者对加强支付业务安全管理的迫切愿望
2025-12-08 12:30:00
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00