• 我的订阅
  • 头条热搜
ibm开源“最先进”和高性能的granite代码模型
...,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。 超高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...点。张政馗表示,大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势,这些技术趋势将推动大模型持续进步,不断拓展应用领域。浪潮海岳大模型定位于企业服务领域,以垂域...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...on & Barto,2018)。理想情况下,该算法既可以快速发现高性能智能体系统,又可以避免陷入局部最优。现有方法包括使用强化学习(Zhuge et al., 2024)或迭代生成新解决方案的 FM(Fernando et al., 2024)作为搜索算法。评估函数:根...……更多
李彦宏替马化腾试错?
...大模型基于腾讯在产业互联网领域沉淀下来的经验,结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施,以及混元大模型,共同构成技术底座。这一底座之上,腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法(包括 OSS-Instruct(61.6)和Evol-Instruct(59.……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...生不息”,也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时,也将在RISC-V生态建设方面长期、持续投入。据悉,进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...业,为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色,是亚马逊云科技的核心优 势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。 关于如何构建高性...……更多
...化学习。 在算力底座层,腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快4天就可以训练万亿参数的...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGPT(gpt-3.5-turbo)时……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。 智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的,超越了之前表现最出色的Mistral7B模型,在数学和代码能力方面表现突出。Gemma这个名字...……更多
...际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...务,而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope:通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点,就是开源稀疏自编码器——Gemma Scope了。语言模型的内部,究竟发生了什么?长久以...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...能解决方案的公司业ABBY在此前接受采访时承认,即使用最先进的系统,也可能出现人工智能错乱或输出不准确的情况,因此,人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验,结果显...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...时为用户提供新功能,包括高级函数调用和检索,以构建高性能的 AI 应用。不过,值得注意的是,Mistral Large 2 虽然是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新,推出第三代自研AI训练芯片Trainium3,还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多
加速落地 京东云大模型已支持数百个场景
...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中,言犀AI开发计算平台,经过近一年的持续打磨,可以提供从基础资源、模型服务,到智能体构建的一站...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-……更多
同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答
...语言推理等任务上,性能比肩OpenAI o1正式版。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...行计算平台和应用程序的编程API,让开发者能通过GPU开展高性能计算,包括: 1. 多个能并行处理任务的核心,实现多线程2. 多种高效管理GPU内存的方法,如全局内存、共享内存和常量内存3. 创建并管理多条并行线程,提高数据...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...用程序开发的战略决策,这种方法使FlutterFlow能够提供更高性能和更具吸引力的用户体验。此外,FlutterFlow还推出了AI驱动的代码助手,能够根据给定的功能需求生成代码。目前,FlutterFlow拥有830000名用户,并部署了超过12000个应...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类知识的图谱,通过知识推理提升知识推理能力。打造基于置信度的模型知识问答和知识库检索的评价体系,实现多源知识...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...问题上训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度,提升...……更多
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
...时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。 从泄露...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...型工程体系vivoAI工程架构专家陈崇沛分享了vivo在大规模高性能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的问题,...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...定律”路径逐渐清晰,“涌现”时刻不定出现,前瞻探索最先进的大模型技术也是重中之重。秉承创立之初“坚持原创,让AI引领人类进步”的目标和愿景,商汤科技的大模型技术和产品已在医疗、教育、法律、工业等各行各业...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00