• 我的订阅
  • 头条热搜
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系讲席教授、人工智能研究院基础模...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
反击OpenAI,谷歌放出最强悍大模型Gemini
...斯·哈萨比斯在谷歌官网联名发文,官宣了最新多模态大模型Gemini 1.0(双子星)版本正式上线。这个上线时间早于外界猜测的明年1月,保密程度很高,仅有少数媒体提前猜出。Gemini 1.0是谷歌筹备了一年之久的GPT4真正竞品,也是...……更多
oppofindx7系列带来行业首个端侧应用70亿参数大模型
...“AI”领域的布局,带来了行业首个端侧应用70亿参数大模型,以及领先的端侧视觉大模型性能。全新的FindX7系列带来了行业首个端侧应用70亿参数大模型,其可以通过“端云协同"架构实现在本地与云端协同运作的效果,让FindX7...……更多
字节“扣子”加入AI战场,2024大模型能搞到钱吗?
...源@视觉中国文 | 趣解商业,作者 | 张凯旌岁末年终,大模型厂商们又秀了一波“肌肉”。2月1日,此前在大模型领域一直保持“静默”状态的字节跳动终于有了新动作,其上线了“Coze扣子”AI Bot开发平台;与过往聊天机器人的...……更多
广东:研发千亿级参数的人工智能通用大模型 形成自主可控的大模型完整技术体系 【广东:研发千亿级参数的人工智能通用大模型 形成自主可控的大模型完整技术体系】财联社11月13日电,广东省人民政府发布关于加快建设通...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
【新智元导读】Meta、UC伯克利、NYU共同提出元奖励语言模型,给「超级对齐」指条明路:让AI自己当裁判,自我改进对齐,效果秒杀自我奖励模型。LLM对数据的大量消耗,不仅体现在预训练语料上,还体现在RLHF、DPO等对齐阶段...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
长时间交通状况预测,可以用大模型实现了。香港大学联合华南理工大学和百度,推出了长时间城市交通预测模型——OpenCity。而且泛化能力极强,可有效应用于广泛的交通预测场景。为了解决传统交通预测模型泛化性及长期预...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
最有希望超越GPT-4的模型来了——美国硅谷时间12月6日上午,谷歌CEO劈柴正式宣布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMin...……更多
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能。集聚...……更多
伏羲大模型亮相:人工智能助力解决次季节和极端天气预测难题
...,今天上海不下雨。”“伏羲”,全名为伏羲气候气象大模型,它融合了人工智能技术与气候气象科学,是行业内首个次季节气候大模型。随着人工智能风潮席卷全球,天气与气候预报系统正在加入到这场技术变革影响的行业之...……更多
英伟达发布80亿参数的ai模型
...伟达(NVIDIA)宣布,其已成功研发并发布了一款全新的AI模型,该模型拥有高达80亿的参数规模,具备精度高、计算效率高等优点,可在GPU加速的数据中心、云和工作站上运行。据介绍,这款新发布的AI模型是基于英伟达在深度学...……更多
ibm开源“最先进”和高性能的granite代码模型
...BM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种变体,适用于复杂应用现代化...……更多
开源大模型的ChatGPT时刻?备受期待的Llama 3 405B即将发布
...顶配,405B版本拥有4050亿个参数,是迄今为止最大的开源模型之一。昨夜凌晨,META突发Llama 3.1-405B评测数据的泄漏事件,有网友预计可能还会同时发布一个Llama 3.1-70B版本,因为“(模型提前泄露)是META的老传统了,去年的Llama模...……更多
随着AI技术的不断突破和迭代,先前涌现的各大模型迎来了进一步的落地应用。近日,小i机器人在上海正式发布华藏通用大模型生态体系,迈出了通用大模型商业化变现的重要一步。在发布会上,工作人员通过华藏输入“帮我...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
全球市值第一背后的AI算力焦虑
...全球市值第一的公司。而在这个“第一”背后,是众多大模型厂商的“算力焦虑”。英伟达股价截图当算力成为人工智能的关键当地时间6月18日美股收盘,英伟达市值达到3.34万亿美元,超越微软成为全球市值最高的公司。就在...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高质量的人工...……更多
马斯克旗下人工智能大模型Grok已正式开源
...工智能初创公司 xAI 迈出了重大一步,开源了其大型语言模型 (LLM) Grok。这意味着企业家、程序员、公司和个人现在可以访问 Grok 的权重和文档,从而允许他们将该模型的副本用于各种目的,包括商业应用。Grok-1 是一个由 xAI 从...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...上了一步台阶,可以向公众发布以供广泛使用。以大语言模型(large language models,以下简称“LLM”)为基础的 text-to-X(文本到任意)技术再在2022年有了突破性进展,分别在 text- to-image(文本到图片)、AI-generated-text(AI 生成……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
掰开安卓手机 满屏都是三个字:大模型
这年头,安卓厂商没个大模型,都不敢开手机发布会了。前脚OPPO刚用大模型升级了语音助手,后脚vivo就官宣自研手机AI大模型;小米发布会则直接将大模型当场塞进手机系统……其竞争激烈程度,不亚于抢芯片首发。到底是怎...……更多
空天信息+人工智能 中国科研团队成功研发遥感智能训推一体机
...院)10月27日发布消息说,该院科研团队通过突破遥感基础模型关键技术,联合相关企业最新研发成功一款命名为“空天·灵犀”的遥感智能训(训练)推(推理)一体机。“空天·灵犀”遥感智能训推一体机。中国科学院空天院 供图“...……更多
乔布斯时代之后,会迎来黄仁勋时代吗?
...AI能够做的工作有了更强烈的预期和紧迫感,而且各种大模型如雨后春笋一般地涌现出来,市场对于高性能芯片的需求度也爆棚了。黄仁勋推出B200的时候,人们忍不住要惊呼了。这是Hooper后的新一代架构,以数学家Blackwell命名。...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...AI基础设施成为AI2.0时代“新基建”数据显示,过去四年,大模型参数量以年均400%复合增长,AI算力需求增长超过15万倍,远超摩尔定律。以CPU为中心的传统计算基础设施已无法满足大模型、生成式AI的新要求。大模型训练对数据质量和...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
【新智元导读】大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得...……更多
SIGGRAPH上首个Real-Time Live的中国团队用生成式AI创建3D世界
...誉提名,其研究成果亦在快速走向产业化。作者使用生成模型的方法,开启了将想象力直接转化为复杂 3D 模型的新路。拿到最佳论文提名的两篇论文——CLAY 和 DressCode,二者的主题分别是 3D 生成和 3D 服装生成。在 SIGGARPH 的 Real...……更多
微软被曝未来3年花1000亿美金囤芯片;杨元庆:AI不是取代人类的智能|钛媒体AGI
...媒体App获悉,4月19日,Meta公布期待已久的多模态开源大模型Llama 3系列。同时,Meta还推出了其首款基于Llama 3开源模型的AI聊天机器人产品——AI助手,直接对标ChatGPT-4。与此同时,科技行业裁员消息频出。谷歌宣布从3月10日开始...……更多
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...景理解、图像分析、机器人感知和图像分割等。语义分割模型是计算机视觉领域中的一种模型,旨在将图像中的每个像素分配给特定的语义类别。与传统的图像分类模型只能给整个图像分配一个类别不同,语义分割模型能够为图...……更多
中国电信何忠江发布千亿参数大模型
...能科技总经理何忠江正式发布了"星辰语义"千亿参数的大模型。据介绍,星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,并且各项能力均有显著提升。何忠江表示,星辰语义拥有超12亿风格数据...……更多
更多关于科技的资讯:
厦门网讯 (厦门日报记者 林露虹)来自厦门的光通信电芯片“单项冠军”登陆科创板。昨日,厦门优迅芯片股份有限公司在上交所科创板上市
2025-12-20 08:51:00
摘要:随着企业业务复杂度的提升与项目制运营的普及,多项目并行管理成为企业提升效率与竞争力的重要模式。然而,项目间的资源冲突
2025-12-20 05:18:00
摘要:在健康中国战略引领下,推进特殊人群运动康复指导课程教学改革已成为新时代体育教育与健康服务体系建设的重要任务。本文探讨如何以数智技术深度赋能传统教学模式
2025-12-20 05:18:00
蔡云霞摘要:企业人力资源管理创新发展是激活人力价值、适配组织转型的核心举措。本文聚焦传统管理中的理念滞后、流程固化等痛点
2025-12-20 05:18:00
12月18日,太原北方重工集团生产车间内机器轰鸣,电光闪烁。国内首台φ820mm特大型无缝钢管矫直机已完成安装,正式交付用户并进入试车阶段
2025-12-20 06:54:00
一家科技研发企业 为什么要做城市安全科普宣传?
今年秋季开学季,杭州叙简科技股份有限公司董事长金国庆在瓶窑中学主讲“开学第一课”,当他为近600名学生讲完“AI赋能城市安全”的讲座后
2025-12-20 07:22:00
昨日,由陕西省商务厅指导、西安市商务局主办的“美美共融”2025西安城市消费品牌合作周在西安浐灞凯悦酒店举行。中国连锁经营协会
2025-12-20 07:49:00
定了!明年4月28日,杭州恒隆广场商场亮相
12月18日,恒隆集团及恒隆地产对外发布消息,集团现任行政总裁兼执行董事卢韦柏,将于2026年8月31日前荣休。同时,在这份对外声明里
2025-12-20 07:52:00
摘要:人工智能技术正广泛应用于企业财务管理的各个方面,目前对于该领域的探讨多集中于提升效率、降低成本与优化决策,而对技术渗透所产生的深层风险并未引起企业重视
2025-12-20 05:18:00
一缕发丝织就“头上帝国”丨链接世界的河南力量
编者按:从中原大地到全球市场,一批来自河南的新服务新供给品牌企业正加速“出海”,以优质产品为全球消费者提供更多选择。12月12日起
2025-12-19 14:36:00
在国家持续推进税收现代化、优化营商环境的大背景下,企业合规经营与诚信纳税已成为衡量其可持续发展能力的重要标尺。新疆瑞源乳业有限公司作为巴州地区乳制品行业的领军企业
2025-12-19 14:47:00
浙江新昌:一家县属国企的低空经济腾飞记
在2025年公路交通行业数据要素应用创新大赛中,“基于异构低空飞行器协同的智慧巡检与低空运营解决方案”项目,荣获全国三等奖
2025-12-19 14:47:00
在数字化转型与精益管理深度融合的当下,电子商城作为企业物资采购、资源配置的核心载体,其运营效率与服务质量直接影响企业整体运营成本与发展活力
2025-12-19 14:47:00
浙江飞流科技创新模式成就“飞”速度
12月1日,河南省辉县市,河南共城智通低空经济有限公司正式开业,今年8月,该公司以“品牌加盟”形式获得浙江飞流科技有限公司(以下简称“飞流科技”)在河南省新乡市的品牌授权
2025-12-19 14:47:00
全省唯一入选,就在常州高新区新桥街道!
近日,工信部发布《再制造机电产品典型应用案例》公示名单,常州市新北区新桥街道企业常州越新传动系统有限公司(以下简称“越新传动”)的“再制造风电增速齿轮箱及其应用——以华奥新能源
2025-12-19 14:48:00