• 我的订阅
  • 头条热搜
国产大模型 DeepSeek-V3 开源:6710 亿参数自研 MoE
...(12 月 26 日)发布博文,宣布上线并同步开源 DeepSeek-V3 模型,用户可以登录官网 chat.deepseek.com,与最新版 V3 模型对话。IT之家援引博文介绍,DeepSeek-V3 是一个 6710 亿参数的专家混合(MoE,使用多个专家网络将问题空间划分为同...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...互能力将是未来数字人发展的重要方向。 腾讯混元大模型赋能AIGC应用落地 推进产业智能化升级 腾讯云大模型产品专家屈蕾 腾讯混元大模型历经迭代日趋成熟,坚持全链路自主研发技术,支持众多场景的创新应用,实现技...……更多
金融大模型应用需量力而行
随着人工智能技术的飞速发展,大模型已经成为全球关注的焦点。尤其在金融领域,大模型的发展呈现迅猛增长趋势,短短两年时间,从百亿级别参数已经成长到了千亿级别参数,引发人们的高度关注。金融业因其具有大规模...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...息,通义千问(Qwen)今天宣布经过数月的努力,Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级,并已在 Hugging Face 和 ModelScope 上同步开源。IT之家附上 Qwen 2.0 主要内容如下:5 个尺寸的预训练和指令微调模型,包括 Qwen2-0.5B、……更多
高能技巧!60 行 NumPy 代码 从头实现一个 GPT
...章汇总将用 60 行 NumPy 代码从头实现一个 GPT。并把 GPT-2 模型权重加载到实现中,从而生成文本。原文链接:https://jaykmody.com/blog/gpt-from-scratch/作者 |Jay Mody译者| 禾木木出品 | CSDN(ID:CSDNnews)在……更多
本文转自:劳动报2024世界人工智能大会探营:最新大模型产品抢先看■劳动报记者 陈宁7月4日至6日,2024世界人工智能大会将在上海拉开帷幕。今年“百模大战”热度依旧不减,大模型依然是这次大会的十大重点议题之一。据...……更多
...前往。日前,南京城市算力网平台顺利完成DeepSeek系列大模型的部署工作并正式面向公众全面上线。平台成功上线了5种不同参数的DeepSeek-R1模型,其中DeepSeek-R1671B顶配参数完整版模型部署在全省尚属首家。南京城市算力网平台是...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
“华米OV”的新战场:手机大模型
...视觉中国文丨光锥智能,作者|刘俊宏,编辑丨王一粟大模型重塑一切的风,吹到了手机行业。在见识了大模型重塑IT基础设施、营销、办公、自动驾驶等行业后,深陷于手机行业销量和技术双周期“低谷”的手机厂商们,急迫...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
...产生直接影响。 首先,OpenAI 评估了当用户姓名不同时,模型会给出怎样的不同的响应。我们知道,姓名通常暗含着文化、性别和种族关联,因此是一个研究偏见的常见元素 —— 尤其考虑到用户常常与 ChatGPT 分享他们的姓名,...……更多
...合鹏城实验室,正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版,这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。近年来,我国遥感数据获取能力不断增强,已进入遥感大数据时代,人工智...……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...开幕的中国计算机大会(CNCC)上,最受瞩目的仍然是大模型。这场计算机领域的“春晚”汇集了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...成的博士论文代码,竟被 AI 在 1 个小时之内实现了。o1 模型已经强到,能够直出博士论文代码了!来自加州大学欧文分校(UCI)的物理学博士 Kyle Kabasares,实测 o1 preview+mini 后发现:自己肝了大约 1 年的博士代码,o1 竟在 1 小时...……更多
teleai星辰语音大模型:多方言能力再次突破
...?你听得懂各地方言吗?时隔不到半年,TeleAI星辰语音大模型的多方言能力再次突破,不仅攻克了湛江话、宜宾话、洛阳话、烟台话等,将方言种类从30种提升至40种的同时,还引入对英文的识别,构建起AI时代的沟通桥梁。当前...……更多
电力大模型:“聊、查、图、写”样样精通
...办法》正式施行已近两个月,“百模大战”不断升级。大模型具有海量的参数、复杂的算法和强大的训练能力,在电力、生物医药、网络安全等领域不断落地应用。为此,本版推出特别策划,展现大模型赋能千行百业的前景。◎...……更多
云鼎科技自主研发国内首套甲醇精馏装置AI优化模型上线运行
...“甲醇精馏工艺智能优化系统”。该系统创新性融合“AI模型+APC(先进过程控制)控制系统”,深度应用人工智能大模型技术,形成两大核心能力:一方面通过精准预测产品质量,消除传统质量监测的滞后性,保障产品质量稳定...……更多
替代NVIDIA,摩尔线程&无问芯穹联手首次实现国产GPU端到端AI大模型实训
...出大招,联合宣布正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,而使用的平台就是摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。这次实训充分验证了夸娥千卡智算集群在大模型训练场景下...……更多
...揭榜行动入围名单,悟空智算申报的“支持超大规模参数模型的训推一体化异构智算平台”项目成功入选,这也是连云港唯一一个入围的项目!在海州区“悟空智算”6876P算力中心,整齐的黑色机柜一字排开,机柜格栅中的服务...……更多
超越GPT-4o!开源科研神器登场,4500万论文检索增强生成靠谱回答
只需几秒钟,开源模型检索4500篇论文,比GPT-4o还靠谱!这就是由华盛顿大学和艾伦人工智能研究所(Ai2)打造的最新模型OpenScholar。它还是首个从论文到数据集、模型检查点都完全开源的科研助手模型。在由20位专家进行的500次...……更多
微软发布旗下最小语言模型phi-2
...会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
最强数学大模型,现在易主!阿里千问大模型团队发布的Qwen2-Math,不仅超越了Llama 3.1-405B,也战胜了GPT-4o、Claude 3.5等一系列闭源模型。而且还会解决竞赛级试题,在GPT-4只能做对一道的AIME 24中,Qwen2-Math答对的题目数量达到了两...……更多
国内首个以国产全功能GPU为底座的大规模算力集群正式落地
...摩尔线程官方发布通告称,摩尔线程首个全国产千卡千亿模型训练平台,摩尔线程KUAE智算中心揭幕仪式成功举办。此举也代表着,国内首个以国产全功能GPU为底座的大规模算力集群正式落地。摩尔线程CEO张建中表示,摩尔线程...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...一新兴的前沿领域还鲜少有人涉足,但绝对值得深耕!AI模型再扩展1000倍的秘密可能就藏在这里。随着Scaling Law越来越成功,LLM的电力和算力消耗也逐渐达到了惊人程度。我们越来越难以想象,当前的模型规模如何能再扩大10倍...……更多
观薇智能“玄黄大模型”发布,展示AI+健康领域创新实力
...嘉宾,共同开启中医中药+精准营养为垂直应用多模态大模型——“玄黄大模型”。玄黄大模型基于庞大语料词元预训练而成,学习了中国中医科学院中医药信息研究所整理的中医药知识图谱、文献医案,并结合了观薇智能母公...……更多
李彦宏断言有点早 开源大模型不弱鸡
...022年11月ChatGPT问世,这一现象级产品迅速点燃了市场的大模型热情。新老科技企业纷纷杀入,誓要抓住移动互联网以来最大的一次产业红利。当行业如火如荼发展一门心思搞技术之时,又出现了“路线之争”:闭源路线:以国外...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
【新智元导读】RNN模型在长上下文中表现不佳?近日,来自清华的研究团队对此进行了深入的实验分析,结果表明:不是RNN的锅。与Transformer相比,RNN模型的一大优势是应对长序列的能力。比如Mamba,内部状态大小始终保持不变...……更多
...ixabay撰文 | 张天祁● ● ●今年年初,DeepSeek发布DeepSeek-R1模型,引发全球的关注。在公开评测中,它的综合能力逼近当时的顶尖大模型,尤其在逻辑推理和数学题上展现出强劲性能,而且它的成本要远低于作比较的其他大模型。...……更多
更多关于科技的资讯:
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00
海尔印尼冷柜工厂奠基将增百万产能
11月27日,海尔印尼冷柜工厂奠基。这座规划年产能100万台的冷柜工厂,将成为海尔智家本土化战略布局及数字化转型落地的又一里程碑
2025-12-01 14:53:00
海尔城市体验中心天津店开业落地数字化转型战略
11月29日,海尔城市体验中心天津店开业。在这里,用户挑选的不再只是一台台冰箱、洗衣机这样的AI单品,而是可以直接把成套解决方案搬回家
2025-12-01 14:54:00