• 我的订阅
  • 头条热搜
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
【新智元导读】TimeMixer++是一个创新的时间序列分析模型,通过多尺度和多分辨率的方法在多个任务上超越了现有模型,展示了时间序列分析的新视角,在预测和分类等任务带来了更高的准确性和灵活性。在数据驱动的时代,时...……更多
大模型降价背后,国产大模型的竞争逻辑变了
配图来自Canva可画随着人工智能技术的快速发展,大模型以其强大的数字处理能力和深度学习能力,不断与各领域交叉融合,逐步成为产业创新的关键抓手,和驱动新质生产力的关键引擎。据国家最新公布的数据显示,截至今年...……更多
阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果
出品 | 搜狐科技作者 | 梁昌均国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得做多余的适配工作。根据...……更多
DeepSeek开源惠四方(科技名家笔谈)
...州深度求索人工智能基础技术研究有限公司推出AI语言大模型DeepSeek,受到用户热烈欢迎。2025年1月20日,DeepSeek-R1发布上线,7天内用户超过1亿。ChatGPT从发布到达到相同的用户规模用时两个月。GitHub是全球最大的代码托管网站,Gi...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
What???一直低调行事的国内初创公司,旗下模型悄悄地跃升成国内第一、世界第五(仅排在o1系列和Claude 3.5之后)!而且是前十名中的唯一一家国产公司。(该榜上国产第二名是阿里开源的qwen2.5-72b-instruct,总榜第13)。而且...……更多
算力浪费超50%!百度AI计算部负责人拆解大模型时代的算力成本
...构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支,他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异构混训,共五个方面的解决方案...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...研究中心主任曾毅等多位嘉宾,分别从 AI 数据、算力、模型与框架、应用、产品、治理、未来目标等多个方面分享前沿进展。钛媒体App简要梳理了各个嘉宾的演讲和圆桌的部分内容,以飨读者。5年投资超1000亿、最高重奖1亿元...……更多
...择了大西洋的一个岩芯以利用其高沉积速度和可靠的年龄模型,但所推测的南大洋通风增加很可能促进了印度洋和太平洋深海的碳流失,有助于解释这些冰阶期间观察到的大气二氧化碳大幅上升。另一种模式发生在大气二氧化碳...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩散模型架构 OmniGen,一种新的...……更多
...发挥算力网络优势与本土化服务能力,结合DeepSeek国产大模型的技术实力,成功打造集“智能知识中枢+公文智创引擎”于一体的政务智慧办公系统,并在南昌、宜春、新余等地本地化部署大模型,构建涵盖材料检索、文本生成、...……更多
AI技术助力5G网络性能提升 无线空口技术引领未来网络设计变革(附图片)
...需解决。这些关键问题包括关键用例选择、数据集构建、模型的管理和算力支撑等。对于5G大数据的挖掘需要借助一系列的AI基础理论和工具,AI工具及算法对数据和算力有比较明确的需求,在5G网络架构进行增强性设计既要考虑...……更多
...图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA...……更多
对话清华刘知远:Scaling Law已被OpenAI验证,知识密度将是未来的核心
...他长期从事知识图谱与语义计算等方面的研究,在基础大模型技术前沿探索上取得多项成果,并和他的学生曾国洋一起创立了端侧大模型公司面壁智能。他认为,今年大模型行业更关注落地,更关注成本和效率。但在对话中,他...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...张建中抛出一句掷地有声的断言。为什么必须是万卡?大模型行业变化很快,客户希望两周内结束战斗,最迟也得在1个月内训练完。假设训练一个5000亿参数模型,有15TB数据,如果只有1000P算力,3年都训不完;如果将时间锁到两...……更多
贵州短临气象大模型成功应用 实现短时强对流天气2小时精准预报
...气象局联合研发基于视频生成跨域迁移技术的短临气象大模型,成功实现对短时强对流极端天气的精准预测,预报及时率可提前至2小时,空间分辨率达到1km×1km级别,单次响应时间仅需3分钟。长期以来,短时强对流天气因其突...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
数势科技—中原银行智能指标平台建设项目入选《沙丘社区大模型先锋案例Top50》
在人工智能蓬勃发展的浪潮中,大模型技术以其卓越的性能和广泛的应用前景,成为推动各行各业创新变革的关键引擎。为了深入挖掘大模型技术在不同领域的应用成果,彰显先锋企业的创新实力与行业引领作用。近日,知名...……更多
李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA
...日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出Yi-34B 和Yi-6B 两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。然而在Yi-34B 的 Hugging Face 开源主页上,开发...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
... 刘育英)中央广播电视总台经济之声“走进上市公司”大模型调研行业发展报告会1月3日在北京举行。会上,经济之声和赛迪研究院共同发布了《2024人工智能大模型行业调查研究报告》(以下简称《报告》)。《报告》呈现了通用...……更多
Meta 公司发布 Imagine Yourself AI 模型
...可扩展性,为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型,这种方法效率低下,而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多
本文转自:新华网在10月11日召开的毫末AI开放日上,大模型如何助推自动驾驶发展成为嘉宾探讨的一个热点领域。会上,毫末智行CEO顾维灏表示,大模型将重塑汽车智能化的技术路线。他认为,自动驾驶3.0时代与2.0时代相比,...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
...-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降...……更多
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...忧——传统软件问题尚能引发如此大的问题,那么站在大模型时代当下,AI+金融,是否又能做到准确可信?正所谓实践是检验真理唯一标准,要回答的这个问题,我们不妨了解一下已经在金融领域“上岗”了的AI大模型。大模型...……更多
欧爱申请多枚gpt-6、gpt-7商标
...,ChatGPT4.0是OpenAI公司旗下最新一代人工智能聊天机器人模型。ChatGPT4.0基于自注意力机制的Transformer架构。这是一种基于深度学习的模型,通过大量的数据训练,它能够抓取文本中的复杂模式,并生成新的、连贯的文本。其运行...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练,永远不会达到接近人类水平的智能。除此之外,他还谈到当前大模型的局限性、以目标驱动的AI架构,包括利用世界模型进行推理和规划,最...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
大语言模型(LLM)的发展同时往往伴随着硬件加速技术的进化,本文对使用 FPGA、ASIC 等芯片的模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
智东西11月5日报道,今日,腾讯宣布开源MoE大语言模型混元Large、腾讯混元3D生成模型Hunyuan3D-1.0正式开源,并全面披露腾讯混元的全系列多尺寸模型、C端应用、B端应用版图。腾讯称混元Large是业界参数规模最大、效果最好的开...……更多
更多关于科技的资讯:
12月10日,公测仅23天月活突破3000万后,千问APP正以周为单位快速迭代,意在打造全能“办事”助手,即日起向所有用户首批开放AI PPT
2025-12-10 15:04:00
存量博弈下,潍柴如何用服务增值让客户体验与企业增长双向奔赴?
鲁网12月10日讯当发动机及装备制造业迈入存量竞争深水区,新能源与智能化技术加速迭代,客户需求越来越高,后市场服务早已超越了简单“售后服务”的范畴
2025-12-10 11:25:00
杭州造火箭了!最快明年首飞,“半小时全球直达”
火箭不仅可以向太空发射卫星,还可以送洲际快递,甚至可以建造太空城实现“太空旅居”?这个听起来充满未来感的愿景,正在杭州迈出第一步
2025-12-10 12:19:00
望海康信荣膺国家级专精特新“小巨人”企业称号
近日,望海康信(北京)科技股份公司成功入选北京市第七批专精特新“小巨人”企业名单,荣获由工业和信息化部认定的国家级专精特新“小巨人”企业称号
2025-12-10 12:05:00
图达通港股上市,黄山市深度投资,助力汽车产业升级发展
大皖新闻讯 2025年12月10日,全球顶尖激光雷达制造商图达通正式在香港联合交易所挂牌上市,截至上午10点30分,涨幅50%
2025-12-10 11:32:00
大皖新闻讯 屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 10:20:00
100天倒计时|于变化中锚定成长,来京宠展驭见2026
十二年为一纪,自2014年破土而生,北京万耀雄鹰国际展览有限公司举办的京宠展已悄然走过它的第一轮春秋,我们看着行业从青涩走向成熟
2025-12-10 10:43:00
杭州日报讯 还没毕业就带队创业,把密码学原理变成孩子爱玩的闯关游戏。日前,在第十一届杭州市大学生科技创新大赛决赛现场,杭州电子科技大学在校生唐萌团队带来的“秘密传递小特工”项目
2025-12-10 06:43:00
智能穿戴产品打开千亿市场空间
从运动健康到生活全场景︐智能穿戴设备以技术融合重塑消费生态︐开启市场新增长极腕间智能手表实时监测心率,耳畔智能耳机同步语音控制
2025-12-10 07:13:00
病理诊断准确率可达到90%以上,AI破局病理诊断痛点每日商报讯 12月4日-6日,第四届中国智能肿瘤学大会在杭州举行。作为大会核心专题板块之一
2025-12-10 07:44:00
从“卖布料”到“卖创意”杭州日报讯 眼下,绍兴未远品牌管理有限公司负责人周凯正为其一手打造的品牌“GUYUANDAI”筹备新系列的作品
2025-12-10 06:44:00
原佳星摘要:互联网行业的迅速发展使数据成为企业核心资源,统计学专业的重要性随之提升。企业在产品运营、用户分析和商业预测中高度依赖统计能力
2025-12-09 05:45:00
近年来,商品过度包装问题引发社会广泛关注。部分商家为提升商品附加值,通过增加包装层数、扩大空隙率、使用高成本材料等方式制造“包装溢价”
2025-12-09 07:18:00
在杭州,两位潜心科研的博士后,不约而同地将目光投向了地球上空数百公里处的低轨卫星。来自西安电子科技大学杭州研究院的孙冉冉博士
2025-12-09 07:49:00
我省交通行业首个自主创新研发的交通数智大模型太行交通数智大模型发布河北日报讯(曹智、谭磊)12月6日,河北交投集团发布太行交通数智大模型
2025-12-09 08:00:00