• 我的订阅
  • 头条热搜
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能,并在Google AI Studio中添加了Gemma 2。在最新的博客中,谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。但是,随着上下文窗口的增……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...CHER VISUAL REPRESENTATION 论文链接:https://arxiv.org/pdf/2411.04997 代码仓库:https://github.com/microsoft/LLM2CLIP 模型下载:https://huggingface……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。TeleChat2-115B在C-Eval的Open Access模型综合榜单排名第一 TeleChat2在模型训练与数据构建方面的研究经验针对超大参数模型训练,Te...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
...型。作为中文大模型的权威基准,C-Eval榜单由清华大学、上海交通大学和爱丁堡大学合作研发,CMMLU榜单由MBZUAI(全球首所人工智能大学)、 上海交通大学、微软亚洲研究院共同推出。这两个平台,均是目前对模型潜力判断最具...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...储库包含用于加载和运行 Grok-1 开放权重模型的 JAX 示例代码。使用之前,用户需要确保先下载 checkpoint,并将 ckpt-0 目录放置在 checkpoint 中, 然后,运行下面代码进行测试:项目说明中明确强调,由于 Grok-1 是一个规模较大(314B...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
...8 张 AMD MI300X GPU 和 JAX 微调 LLaMA 3.1 405B 模型的方法,所有代码现已开源。Github 链接:https://github.com/felafax/felafax 机器之心对博客内容进行了不改变原意的编译、整理,以下是博客内容:JAX 尤其适合非英伟……更多
P/NP问题50年:基础理论举步维艰,但AI正在不可能中寻找可能
...2017年DeepMind开发的AlphaZero[35]。AlphaZero使用了一种被称为蒙特卡洛树搜索(MCTS)的技术——让双方玩家随机地落子从而决定最佳的棋路方案。AlphaZero使用深度学习来预测棋局的最佳分布,以优化使用MCTS获胜的机会。虽然AlphaZero并...……更多
...劳动报记者 陈宁7月4日至6日,2024世界人工智能大会将在上海拉开帷幕。今年“百模大战”热度依旧不减,大模型依然是这次大会的十大重点议题之一。据介绍,目前上海已有34款大模型通过备案,产生了制造业、金融、具身智...……更多
提质降价,国产大模型加速奔跑
...的解决方案非常实用,同时提供了具体的代码示例。”在上海从事房地产开发工作的薛天朗说。据百度智能云AI与大模型平台业务副总经理李景秋介绍,扩展大模型应用场景需要满足不同维度的要求:一是基座模型质量,要有一...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini 1.0 Ultra, Gemini 1.5 Pro也在超过一半的基准(16/31)上表现更好,特别是在文本基准(10/13)和许多视觉基准(6……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...环境进行实时感知和安全导航。然而,这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。而且在实际应用过程中容易出现误差累积的现象,比如前方突然出现行人,由于感知模块的漏检,下游的预测决策模块没...……更多
中小机构弯道超车窗口来临?DeepSeek开源提供加速度
...型具备广泛的能力,比如理解问题、进行数学运算和生成代码等,但在风控这一垂直领域,其表现并不尽如人意。”其原因在于大模型的训练主要依赖于公开的互联网数据和代码,缺乏针对风控领域的专门数据语料训练,因此其...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...的不断落地应用,对私域知识、本地场景的深刻理解,AI 代码助手的能力边界正在不断被打破。年初,英伟达创始人、CEO 黄仁勋的一番话引发了计算机行业内外的热议。他表示:「生成式 AI 的持续发展大大降低了学习编程的意...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...个审核模型。GPT-4 Turbo预览版(gpt-4-0125-preview)特别针对代码生成等任务进行了优化,以减少模型的“懒惰”行为。OpenAI还计划推出具有视觉功能的GPT-4 Turbo,并在未来几个月全面发布。OpenAI还推出了两个新的文本嵌入模型:text-...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...RAG)等用例,准确度损失不到2%。四、Amazon Q Developer超越代码,覆盖更广泛开发任务Amazon Q Developer辅助编程平台此次升级的重点是超越代码完成,帮助开发人员完成端到端软件生命周期中涉及的更广泛日常任务。Amazon Q Developer的...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...未真正丢失,只是被隐藏了。如果我们把神经网络看作是代码,权重就是源代码,微调实际上可能有效地修改了这些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
apollo开放平台9.0全面升级
...,调参方式简化使得调参效率提升1倍,新增插件机制让代码学习成本降低90%的同时代码量降低50%,大大提高了Apollo的二次开发能力。Apollo开放平台9.0还首次适配了ARM架构。算法方面,Apollo开放平台9.0在此前的基础上优化了感知...……更多
金融企业2024年需要关注的两大DevOps趋势
...。DevOps牵涉到多个自动化工具链的集成,包括需求管理、代码管理、持续集成、测试、自动化部署和制品库等多个环节。为更好地支持DevOps,金融企业可能需要进行组织结构调整,并对人员进行培训。更多的金融企业通过采用Dev...……更多
商汤大装置:打造人工智能算力“样板间”,从AI 1.0跨越到2.0时代
在上海临港新片区,中国AIDC建设的“样板间”——商汤科技上海新一代人工智能计算与赋能平台(商汤临港AIDC)正以惊人的速度,不断挑战自我。目前,算力规模已高达8100 petaFLOPS,远远超出立项规划算力。以“坚持原创,让A...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...微软亚洲互联网工程研究院副院长姜大昕创办,此前获得上海国资、腾讯、五源资本、启明创投等投资,并位列六小龙之列。姜大昕表示,阶跃在成立之初,就规划了实现AGI的路线图,包括模拟世界、探索世界和归纳世界三个阶...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...同样取得了重要突破,研发能识图、会编程的九天·湛卢代码大模型。九天·湛卢代码大模型,融合海量代码库、技术文档,为研发人员提供智能、高效、安全的编程体验。基于湛卢代码大模型,移动云研发湛卢代码助手、湛卢...……更多
AI将爆发哪些超级应用?
...,相当于约30万块英伟达A100的算力总和。国内,商汤位于上海临港的上海人工智能计算中心(AIDC)算力已达到14,000 PFLOPS(截至今年8月);华为车Bu的ADS训练算力达3,500PFLOPS(截至今年7月);理想训练算力达5,390 PFLOPS(截至今年8...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的...……更多
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...,两种方法能达到相同效果。新方法名叫LoRA-Dash,由来自上海交通大学和哈佛大学的研究人员提出,主要针对特定任务微调模型往往需要大量计算资源这一痛点。研究完成的主要工作是:对高效微调过程中的TSD(Task-specific Directi...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
... 算法被人工智能顶级会议 NeurIPS 2024 录用,目前已开放源代码和预训练权重。论文标题:MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes 论文链接……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...架。 针对不同技术背景的开发者,AppBuilder分别提供了低代码态和代码态两种产品形态。低代码态产品适用于非技术背景的开发者以及通用的开发需求,用户只需要简单点选就可以定制和上线AI应用。针对具有深度开发需求的用...……更多
更多关于科技的资讯:
厦门半导体显示产业孵化器揭牌
天马微电子已在厦建设5条先进生产线,助推厦门形成主流显示技术全覆盖的布局。图为参会代表参观天马微电子的展出产品。(厦门日报记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)打造新型显示产业高地
2025-12-11 08:18:00
Meta使用阿里千问优化其最新AI模型
12月10日晚间消息,据彭博社报道,美国科技巨头Meta在训练其代号为“牛油果”的新模型时,使用了阿里巴巴Qwen模型进行蒸馏优化
2025-12-11 08:34:00
当iPhone屏幕突然冻结在苹果标志上无法启动,或是在系统更新后陷入无限重启的循环,很多用户的第一反应是连接电脑使用iTunes恢复
2025-12-11 08:38:00
鲁网12月9日讯深耕新能源与电力装备产业20余年的制造业单项冠军企业——特锐德集团,顺应国家“双碳”战略与产业转型升级需求
2025-12-11 08:39:00
近日,华夏基金旗下股权投资平台——华夏股权宣布完成对杭州云深处科技的联合领投。此次投资不仅是华夏股权在机器人及智能装备产业链的关键战略布局
2025-12-11 09:42:00
纵览宠粉计划丨集福卡赢好礼!纵览新闻宠粉活动放大招啦~
纵览宠粉计划第四轮来啦!12月11日至18日福利拉满集齐八张福卡超多好礼带回家点击上图直达活动不管你是纵览的老粉还是刚加入的新朋友这场专属活动千万别错过在前两场活动广受欢迎的演出票
2025-12-11 09:48:00
近日,记者调查发现,美颜生鲜灯并未完全退出市场,而是以隐蔽姿态继续“发光”。在沿街商铺、小区周边门店内,有不少商家使用明令禁止的红罩红光生鲜灯
2025-12-11 09:53:00
以时光炼技能,以热爱赴荣光:华润万家第二届“万家工匠”全国技能大赛总决赛颁奖典礼温暖落幕
聚光灯照亮领奖台,掌声致敬每一份坚守,12月8日下午,第二届“万家工匠”全国技能大赛总决赛颁奖典礼圆满落幕。历经赛场的激烈角逐与专业的层层考量
2025-12-11 10:51:00
在心理健康日益受到全社会重视的背景下,广州勤圣伊科技有限公司(以下简称“勤圣伊科技”)凭借其“科技融合专业”的创新模式
2025-12-11 11:02:00
近日,专注于心理健康领域的广州勤圣亦科技有限公司(以下简称“勤圣亦科技”)宣布,其通过“科技+专业服务”的创新模式,在心理咨询服务数字化与普惠化方面取得显著进展
2025-12-11 11:04:00
12月9日,云深处科技宣布完成超5亿元人民币C轮融资。本轮融资由招银国际和华夏基金联合领投,中国电信、中国联通旗下基金参与战略投资
2025-12-11 11:15:00
以融资租赁之力,赋能产业升级 ——2025 PA“租赁节”拉开帷幕
2025年是“十四五”规划收官之年,我国产业结构转型进入深化攻坚阶段,融资租赁作为服务实体经济、产业转型升级中的重要力量
2025-12-11 11:22:00
依靠学习 走向未来——好书推荐书单:以书为帆 智行致远
01、《电动中国》作者:杨旭东、黄郑出版社:新华出版社书中将中国新能源科技发展置于能源革命与国际竞争的双重视角下,分析动力电池
2025-12-11 12:43:00
近年来,AI驱动的修复视频清晰度软件逐渐普及,无论是老旧的VHS录像、噪点明显的夜间视频,还是压缩导致的画质损失,都有机会被修复
2025-12-11 11:06:00
二手平台价格水涨船高 便利带来隐私权限风险商报讯 今年最火的行业是什么?无疑就是AI。现在不仅仅是下载AI App
2025-12-11 11:46:00