• 我的订阅
  • 头条热搜
ibm开源“最先进”和高性能的granite代码模型
...,IBM在年度THINK大会上宣布,IBM现已开源其“最先进”和高性能的Granite(花岗岩)代码模型。IT之家附开源链接如下:GitHub:点此进入HuggingFace:点此进入Granite代码模型的参数范围从3B到34B,并且有基础模型和指令跟随模型两种...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使用稀疏激活混合专家 (MoE)。MoE 在每一层都有几个专家,每次只激活其中的一...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...或NVIDIA H100 Tensor Core GPU上以全精度高效运行推理,在保持高性能的同时大幅降低成本。这使得AI部署更加便捷和经济实惠。 超高速推理:Gemma 2经过优化,能够在各种硬件上以惊人的速度运行,无论是强大的游戏笔记本、高端台...……更多
开源低代码平台“碰撞”浪潮海岳大模型,打造高效智能开发新体验
...点。张政馗表示,大模型的发展呈现多模态化、端侧化、高性能化、多领域通用、跨领域融合、个性化、统一架构等趋势,这些技术趋势将推动大模型持续进步,不断拓展应用领域。浪潮海岳大模型定位于企业服务领域,以垂域...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...on & Barto,2018)。理想情况下,该算法既可以快速发现高性能智能体系统,又可以避免陷入局部最优。现有方法包括使用强化学习(Zhuge et al., 2024)或迭代生成新解决方案的 FM(Fernando et al., 2024)作为搜索算法。评估函数:根...……更多
李彦宏替马化腾试错?
...大模型基于腾讯在产业互联网领域沉淀下来的经验,结合高性能计算集群 HCC、高性能网络、向量数据库等基础设施,以及混元大模型,共同构成技术底座。这一底座之上,腾讯云 TI 平台为客户提供大模型平台和工具链。腾讯云 ...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...数据科学编程、代码编辑)中,SelfCodeAlign都战胜了之前最先进的指令微调方法OctoPack。此外,在HumanEval+上,SelfCodeAlign的性能超越了基于GPT-3.5-Turbo的蒸馏方法(包括 OSS-Instruct(61.6)和Evol-Instruct(59.……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...生不息”,也代表着进迭时空在面向RobotComputer时代开发高性能芯片的同时,也将在RISC-V生态建设方面长期、持续投入。据悉,进迭时空在这场年度发布会上还发布了搭载中K1芯片的SpacemiTMuse™Book、SpacemiTMuse™Pi和SpacemiTMuse™Box等...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...业,为他们提供芯片、存储、网络在内的基础设施服务。高性能低成本与绿色,是亚马逊云科技的核心优 势。目前已经有 Anthropic、Mistral AI、Hugging Face 等众多明星 AI 团队在亚马逊云科技进行大模型的训练。 关于如何构建高性...……更多
...化学习。 在算力底座层,腾讯为汽车行业大模型提供了高性能、高带宽、低延迟的算力基座支持。新一代HCC高性能计算集群,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快4天就可以训练万亿参数的...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...方面,7500万参数的CodeFusion在top-1准确率指标上,可以与最先进的350M-175B模型相媲美。论文地址:https://arxiv.org/abs/2310.17680这篇论文的工作很有意义,但引起大家格外注意的却是——作者在对比ChatGPT(gpt-3.5-turbo)时……更多
智谱AI新大模型来袭:部署价格大降50%,免费商用,做应用能力逼近GPT3.5 | 最前线
...的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。 智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在...……更多
谷歌再出大招,发布最新开源大模型Gemma,笔记本上即可运行
...过开源其最新的AI模型Gemma,向业界展示了其在轻量级、高性能AI技术方面的最新进展。这一轻量级模型系列号称是当前同等规模中最先进的,超越了之前表现最出色的Mistral7B模型,在数学和代码能力方面表现突出。Gemma这个名字...……更多
...际标准图文评测数据集上取得SOTA(State of the art,意为“最先进的”);代码增强模块Code Interpreter可以根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强模型WebGLM接入了搜索增强能力,可以...……更多
首个AI程序员上岗,码农们暂且不必过度焦虑
...能解决方案的公司业ABBY在此前接受采访时承认,即使用最先进的系统,也可能出现人工智能错乱或输出不准确的情况,因此,人工验证目前依然必不可少、至关重要。网络上有程序员分享过用大模型来生产代码的体验,结果显...……更多
iPhone可跑2B小钢炮!谷歌Gemma 2来袭,最强显微镜剖解LLM大脑
...务,而9B和27B版本则为对延迟要求较低的离线应用提供更高性能。Gemma Scope:通过开源稀疏自编码器揭示AI决策过程此次同时发布的另一大亮点,就是开源稀疏自编码器——Gemma Scope了。语言模型的内部,究竟发生了什么?长久以...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...时为用户提供新功能,包括高级函数调用和检索,以构建高性能的 AI 应用。不过,值得注意的是,Mistral Large 2 虽然是开放的,但只限于研究和非商业用途。它提供了开放的权重,允许第三方根据自己的需求对模型进行微调。这...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...2实例专为包括大语言模型和潜在扩散模型在内的生成式AI高性能深度学习训练而构建。其AI硬件全家桶也哐哐上新,推出第三代自研AI训练芯片Trainium3,还发布了其史上最强AI服务器Trn2 UltraServer。1、第三代自研AI训练芯片AWS发布...……更多
加速落地 京东云大模型已支持数百个场景
...AI开发计算平台、向量数据库、混合多云操作系统云舰、高性能存储平台云海、软硬一体虚拟化引擎京刚等核心产品。其中,言犀AI开发计算平台,经过近一年的持续打磨,可以提供从基础资源、模型服务,到智能体构建的一站...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...Github等技术社区直接下载,免费可商用。腾讯云TI平台和高性能应用服务HAI也开放接入这两个模型,为模型的精调、API调用及私有化部署提供一站式服务。混元Large Hugging Face地址:https://huggingface.co/tencent/Tencent-Hunyuan-……更多
同时登顶中美下载排行榜,DeepSeek凭啥超越GPT?看它自己怎么回答
...语言推理等任务上,性能比肩OpenAI o1正式版。低成本实现高性能模型研发,对用户来说的体验感也立竿见影——它功能强大,但却免费使用,并且DeepSeek还将代码面向开发者进行了开源。据了解,DeepSeek R1没有使用业内普遍使用...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...行计算平台和应用程序的编程API,让开发者能通过GPU开展高性能计算,包括: 1. 多个能并行处理任务的核心,实现多线程2. 多种高效管理GPU内存的方法,如全局内存、共享内存和常量内存3. 创建并管理多条并行线程,提高数据...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...用程序开发的战略决策,这种方法使FlutterFlow能够提供更高性能和更具吸引力的用户体验。此外,FlutterFlow还推出了AI驱动的代码助手,能够根据给定的功能需求生成代码。目前,FlutterFlow拥有830000名用户,并部署了超过12000个应...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...索场景需求。深度定制全文检索框架,支持文档类知识的高性能精准检索。依托知识图谱技术,构建概念类知识的图谱,通过知识推理提升知识推理能力。打造基于置信度的模型知识问答和知识库检索的评价体系,实现多源知识...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...问题上训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI开发平台、AIAgent平台等能力,有效降低大模型训练难度,提升...……更多
GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,虽然鸽了发布会但代码已上传
...时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho,从更新的前端代码中扒出SearchGPT的界面。 从泄露...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...型工程体系vivoAI工程架构专家陈崇沛分享了vivo在大规模高性能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的问题,...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...定律”路径逐渐清晰,“涌现”时刻不定出现,前瞻探索最先进的大模型技术也是重中之重。秉承创立之初“坚持原创,让AI引领人类进步”的目标和愿景,商汤科技的大模型技术和产品已在医疗、教育、法律、工业等各行各业...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00
雷军提前透露年度演讲细节,晒照新T恤“正是闯的年纪”被粉丝要链接
9月25日,雷军年度演讲将在今晚7点举行,这次不光是演讲,还是小米17系列等各种新品的发布会。关于今晚的演讲和发布会,25日下午
2025-09-25 17:34:00
齐鲁晚报·齐鲁壹点 记者 张召旭近日,为紧密配合《山东省食品经营许可审查细则》的落地施行,山东省全新改造升级的食品经营许可系统正式上线运行
2025-09-25 17:34:00
中国AI“黑科技”集结数贸会,AI硬件备受瞩目
9月25日,第四届全球数字贸易博览会在杭州开幕,作为国内唯一以数字贸易为主题的国家级展会,本届数贸会汇聚全球顶尖的数字科技与AI创新成果
2025-09-25 17:40:00
近日,山东移动聊城分公司组织技术团队专程赴莘县翰林学校,开展互联网专线及校园网络全面巡检与优化工作,通过端到端的全流程保障
2025-09-25 18:06:00
高德刘振飞:空间智能,就是让AI理解和预测真实世界的复杂性
高德地图董事长 刘振飞9月25日云栖大会期间,高德地图董事长刘振飞于2025高德技术峰会上致辞,系统阐述了高德全面转向“空间智能”的战略思考与实践
2025-09-25 18:06:00
京东发布AI全景图,未来三年持续投入构建万亿人工智能生态
9月25日,主题为“Enjoy AI”的JDDiscovery-2025京东全球科技探索者大会在北京举行。京东在会上发布了AI全景图
2025-09-25 18:10:00