• 我的订阅
  • 头条热搜
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能,并在Google AI Studio中添加了Gemma 2。在最新的博客中,谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访问权限。但是,随着上下文窗口的增……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...CHER VISUAL REPRESENTATION 论文链接:https://arxiv.org/pdf/2411.04997 代码仓库:https://github.com/microsoft/LLM2CLIP 模型下载:https://huggingface……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方面能力均有大幅提升。TeleChat2-115B在C-Eval的Open Access模型综合榜单排名第一 TeleChat2在模型训练与数据构建方面的研究经验针对超大参数模型训练,Te...……更多
引领消费金融数智化时代 招联发布行业首个开源金融大模型“招联智鹿”
...型。作为中文大模型的权威基准,C-Eval榜单由清华大学、上海交通大学和爱丁堡大学合作研发,CMMLU榜单由MBZUAI(全球首所人工智能大学)、 上海交通大学、微软亚洲研究院共同推出。这两个平台,均是目前对模型潜力判断最具...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...储库包含用于加载和运行 Grok-1 开放权重模型的 JAX 示例代码。使用之前,用户需要确保先下载 checkpoint,并将 ckpt-0 目录放置在 checkpoint 中, 然后,运行下面代码进行测试:项目说明中明确强调,由于 Grok-1 是一个规模较大(314B...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
豆包代码大模型,不小心给曝光了!在字节开源的代码大模型评估基准FullStack Bench里面,出现了此前字节未披露过的Doubao-Coder。不过目前还只是Preview版,还并没有上线。它在多种编程语言上的性能表现如下,可以看到在闭源模...……更多
微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B
...8 张 AMD MI300X GPU 和 JAX 微调 LLaMA 3.1 405B 模型的方法,所有代码现已开源。Github 链接:https://github.com/felafax/felafax 机器之心对博客内容进行了不改变原意的编译、整理,以下是博客内容:JAX 尤其适合非英伟……更多
P/NP问题50年:基础理论举步维艰,但AI正在不可能中寻找可能
...2017年DeepMind开发的AlphaZero[35]。AlphaZero使用了一种被称为蒙特卡洛树搜索(MCTS)的技术——让双方玩家随机地落子从而决定最佳的棋路方案。AlphaZero使用深度学习来预测棋局的最佳分布,以优化使用MCTS获胜的机会。虽然AlphaZero并...……更多
...劳动报记者 陈宁7月4日至6日,2024世界人工智能大会将在上海拉开帷幕。今年“百模大战”热度依旧不减,大模型依然是这次大会的十大重点议题之一。据介绍,目前上海已有34款大模型通过备案,产生了制造业、金融、具身智...……更多
提质降价,国产大模型加速奔跑
...的解决方案非常实用,同时提供了具体的代码示例。”在上海从事房地产开发工作的薛天朗说。据百度智能云AI与大模型平台业务副总经理李景秋介绍,扩展大模型应用场景需要满足不同维度的要求:一是基座模型质量,要有一...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。即使是对比Gemini 系列的高端产品Gemini 1.0 Ultra, Gemini 1.5 Pro也在超过一半的基准(16/31)上表现更好,特别是在文本基准(10/13)和许多视觉基准(6……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...环境进行实时感知和安全导航。然而,这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。而且在实际应用过程中容易出现误差累积的现象,比如前方突然出现行人,由于感知模块的漏检,下游的预测决策模块没...……更多
中小机构弯道超车窗口来临?DeepSeek开源提供加速度
...型具备广泛的能力,比如理解问题、进行数学运算和生成代码等,但在风控这一垂直领域,其表现并不尽如人意。”其原因在于大模型的训练主要依赖于公开的互联网数据和代码,缺乏针对风控领域的专门数据语料训练,因此其...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...的不断落地应用,对私域知识、本地场景的深刻理解,AI 代码助手的能力边界正在不断被打破。年初,英伟达创始人、CEO 黄仁勋的一番话引发了计算机行业内外的热议。他表示:「生成式 AI 的持续发展大大降低了学习编程的意...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...个审核模型。GPT-4 Turbo预览版(gpt-4-0125-preview)特别针对代码生成等任务进行了优化,以减少模型的“懒惰”行为。OpenAI还计划推出具有视觉功能的GPT-4 Turbo,并在未来几个月全面发布。OpenAI还推出了两个新的文本嵌入模型:text-...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...RAG)等用例,准确度损失不到2%。四、Amazon Q Developer超越代码,覆盖更广泛开发任务Amazon Q Developer辅助编程平台此次升级的重点是超越代码完成,帮助开发人员完成端到端软件生命周期中涉及的更广泛日常任务。Amazon Q Developer的...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...未真正丢失,只是被隐藏了。如果我们把神经网络看作是代码,权重就是源代码,微调实际上可能有效地修改了这些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消...……更多
1行代码改进大模型训练,Llama训练速度升至1.47倍,华人团队出品
只要改一行代码,就能让大模型训练效率提升至1.47倍。拥有得州大学奥斯汀分校背景四名华人学者,提出了大模型训练优化器Cautious Optimizers。在提速的同时,Cautious能够保证训练效果不出现损失,而且语言和视觉模型都适用。...……更多
apollo开放平台9.0全面升级
...,调参方式简化使得调参效率提升1倍,新增插件机制让代码学习成本降低90%的同时代码量降低50%,大大提高了Apollo的二次开发能力。Apollo开放平台9.0还首次适配了ARM架构。算法方面,Apollo开放平台9.0在此前的基础上优化了感知...……更多
金融企业2024年需要关注的两大DevOps趋势
...。DevOps牵涉到多个自动化工具链的集成,包括需求管理、代码管理、持续集成、测试、自动化部署和制品库等多个环节。为更好地支持DevOps,金融企业可能需要进行组织结构调整,并对人员进行培训。更多的金融企业通过采用Dev...……更多
商汤大装置:打造人工智能算力“样板间”,从AI 1.0跨越到2.0时代
在上海临港新片区,中国AIDC建设的“样板间”——商汤科技上海新一代人工智能计算与赋能平台(商汤临港AIDC)正以惊人的速度,不断挑战自我。目前,算力规模已高达8100 petaFLOPS,远远超出立项规划算力。以“坚持原创,让A...……更多
阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用
...微软亚洲互联网工程研究院副院长姜大昕创办,此前获得上海国资、腾讯、五源资本、启明创投等投资,并位列六小龙之列。姜大昕表示,阶跃在成立之初,就规划了实现AGI的路线图,包括模拟世界、探索世界和归纳世界三个阶...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...同样取得了重要突破,研发能识图、会编程的九天·湛卢代码大模型。九天·湛卢代码大模型,融合海量代码库、技术文档,为研发人员提供智能、高效、安全的编程体验。基于湛卢代码大模型,移动云研发湛卢代码助手、湛卢...……更多
AI将爆发哪些超级应用?
...,相当于约30万块英伟达A100的算力总和。国内,商汤位于上海临港的上海人工智能计算中心(AIDC)算力已达到14,000 PFLOPS(截至今年8月);华为车Bu的ADS训练算力达3,500PFLOPS(截至今年7月);理想训练算力达5,390 PFLOPS(截至今年8...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的...……更多
上海:加速实施“模塑申城”
本文转自:人民网-上海频道人民网记者 董志雯 葛俊俊上海开年首个科技盛会来了!“2025全球开发者先锋大会”将于2月21日至23日在徐汇举办,旨在推动人工智能产业场景落地,加速人工智能商业化进程。今年,上海正瞄准技...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...,两种方法能达到相同效果。新方法名叫LoRA-Dash,由来自上海交通大学和哈佛大学的研究人员提出,主要针对特定任务微调模型往往需要大量计算资源这一痛点。研究完成的主要工作是:对高效微调过程中的TSD(Task-specific Directi...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
... 算法被人工智能顶级会议 NeurIPS 2024 录用,目前已开放源代码和预训练权重。论文标题:MimicTalk: Mimicking a personalized and expressive 3D talking face in minutes 论文链接……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...架。 针对不同技术背景的开发者,AppBuilder分别提供了低代码态和代码态两种产品形态。低代码态产品适用于非技术背景的开发者以及通用的开发需求,用户只需要简单点选就可以定制和上线AI应用。针对具有深度开发需求的用...……更多
DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
...技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任...……更多
更多关于科技的资讯:
匠心护航丨济宁移动圆满完成2025嘉祥圣德山野音乐节通信保障
鲁网10月20日讯10月18-19日,“共赴山野之约,让旋律在自然间共鸣”群星演唱会在嘉祥九顶山激情开唱,华语乐坛知名歌手轮番登台
2025-10-20 12:17:00
移动的 “智算样板间” 亮相青岛,施耐德电气破解算力基建难题
10月17日,一场穿行14城、总里程近2万公里的技术巡展抵达青岛。施耐德电气关键电源巡卡车化身 “数据中心行业的技术样板间”
2025-10-20 12:45:00
彰显多维综合实力,Hape重装亮相2025中国玩具展
10月15至17日,由中国玩具和婴童用品协会(简称中国玩协)主办的第二十三届CTE中国玩具展&潮玩展、第十八届CLE中国授权展
2025-10-20 13:19:00
富士胶片91年传承,始终深耕影像领域,在不同时代适时推出符合当下需求的产品.。影像的发展从未离开过"光",近日FUJIKINA 2025富士胶片影像周以"光的交响曲"为题拉开序幕
2025-10-20 13:19:00
安踏儿童足弓PRO跑鞋获国际设计金奖 以科技守护青少年足弓健康
安踏儿童旗下产品“足弓PRO跑鞋”凭借对儿童足弓健康成长的深刻洞察与科学的产品设计,荣获2025年缪斯设计奖(MUSE Design Awards)金奖
2025-10-20 13:49:00
厦门网讯(厦门日报记者 李晓平)日前,厦门市工业和信息化局组织开展人工智能政策资金申报工作,“真金白银”推进今年我市出台的《厦门市进一步推动人工智能产业发展若干措施》(以下简称《若干措施》)落地见效
2025-10-20 08:56:00
报告:研学旅游市场分化趋势明显 监管滞后发展
10月18日,“2025首届旅行服务大会暨交易展——‘跨界协作•链动未来’研学新生态思享会”在海南三亚保利国际会展中心举行
2025-10-20 09:30:00
西乡街道企业人才训练营走进北科瑞声探寻AI声纹新未来
10月16日,由西乡街道党群服务中心主办的“AI赋能·智汇西乡”企业人才训练营系列活动之北科瑞声参访学习在新一代产业园顺利举行
2025-10-20 09:48:00
姬源在数字化浪潮席卷全球的今天,一个特殊的群体正在悄然形成,他们就是阿尔法一代(GenerationAlpha)。这一代人正值智能手机
2025-10-20 10:49:00
2025微博V影响力大会揭晓9组大V荣誉,“尽兴分享”推动社会价值沉淀
10月18日,2025微博V影响力大会在北京・微博IN跨次元引力场隆重举行。作为微博主办的年度重磅平台级活动,此次大会以“尽兴分享
2025-10-20 10:49:00
新闻纵深·聚焦2025中国国际数字经济博览会|人工智能赋能产业升级“下半场”
阅读提示数字浪潮,奔涌而至。10月17日至19日,2025中国国际数字经济博览会在石家庄举办。这场综合性数字经济大会,不仅搭建起国际数字经济交流合作的高端平台
2025-10-20 07:35:00
聚焦2025中国国际数字经济博览会|数字“加料”,生活可以这么“潮”
10月17日,观众和下棋机器人对弈。河北日报记者 史晟全摄数字让生活更美好。2025中国国际数字经济博览会上,众多数智技术闪亮登场
2025-10-20 07:37:00
河北日报讯(记者宋平)10月19日,2025京津冀AI赋能教育新生态大会在石家庄举办。来自政府、高校、科研机构与企业的与会嘉宾
2025-10-20 07:42:00
青春华章丨制造业“数智化”,“脑力”岗位需求旺
南航双选会上来了237家制造业单位制造业“数智化”,“脑力”岗位需求旺□南京日报/紫金山新闻记者姜静实习生黄佳琪杨久久400多家用人单位中
2025-10-20 07:43:00