• 我的订阅
  • 头条热搜
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
huggingface公布“smollm”小语言模型家族
7月20日消息,如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周HuggingFace便公布了“SmolLM”小语言模型家族,其中包含1.35亿、3.6亿及17亿参数模型。据介绍,这些模型号称是以精心策划的...……更多
阿里巴巴即将开源目前国内参数规模最大的大模型 【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯,阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露,阿里巴巴即将开源720亿参数...……更多
中国电信何忠江发布千亿参数大模型
...科技总经理何忠江正式发布了\"星辰语义\"千亿参数的大模型。据介绍,星辰语义大模型是中国电信自研大模型的升级,由此前的百万参数量级升至千亿,并且各项能力均有显著提升。何忠江表示,星辰语义拥有超12亿风格数据、...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
阿里巴巴智能信息事业群发布千亿级参数夸克大模型 【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电,记者今日获悉,阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型,将应用于通...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...巨头微软或正在研发参数达5000亿的全新AI(人工智能)大模型,将正面叫板谷歌和OpenAI。当地时间5月6日,据外媒报道,微软正在研发一款名为MAI-1的最新AI大模型,其规模远超出微软此前推出的一些开源模型,在性能上或能与谷...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
?Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏快科技6月7日消息,Intel官方宣布,旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2(Qwen2)的全球发布提供支持,已取得ModelScope、阿里云PAI、OpenVINO等...……更多
微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
微软开源1bit大模型推理框架!现在1000亿参数大模型量化后单CPU可跑,速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现,开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数(如FP16或BF16)形...……更多
...:人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会(GDC)上首发。该大模型由财跃星辰自研推出,上海报业集团旗下界面财联社与通用大模型公司阶跃星辰共...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
...绩报告,财报指出:“腾讯混元已经发展成为领先的基础模型,在数学推导、逻辑推理以及多轮对话中性能卓越。”并首度披露腾讯混元采用混合专家模型结构,已扩展为万亿参数规模。自亮相以来,腾讯混元大模型持续迭代升...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
我国发布首个亿级参数量地震波大模型:名为“谛听”
...,据成都科技局官方公众号介绍,日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发,是首个亿级参数量的地震波大模型。同时,“谛听”也是目...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
...:德宏团结报性能提升30%!中国电信进一步开源12B星辰大模型本报讯 近日,中国电信开源12B参数规模星辰语义大模型TeleChat-12B,相较1月开源7B版本,内容、性能和应用等方面整体效果提升30%,其中,多轮推理、安全问题等领域...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
20亿参数!谷歌发布轻量级开源人工智能模型Gemma
...CNMO新闻】近日,谷歌发布了其首个重要的开源大型语言模型Gemma,这标志着自从OpenAI的ChatGPT引领了人工智能聊天机器人热潮以来,在2022年取得了重要突破。Gemma是由谷歌DeepMind和其它团队共同开发的,旨在为开发人员和研究者提...……更多
大模型这把大火,烧到了手机领域
配图来自Canva可画AI大模型从年初一直火到了年尾,但似乎离普通人还有些距离。不过,现在情况似乎有了一些变化,各大手机厂商们,正在争先恐后地把大模型装进手机里,让AI变得“触手可及”。在很多人看来,手机厂商入...……更多
...自:文汇报 本报讯 国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”于昨天在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训练,具备...……更多
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
5620亿参数!谷歌发布史上最大“通才”ai模型
...大学的一组人工智能研究人员推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。PaLM-E是迄今为止已知的最大VLM(视觉语言模型)。作为一种多模态具身VLM,它不仅可以理解图像,还能理解、...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion这样的模型还要再贵一个数量级。大模型时代...……更多
ChatGPT劝退创业者
...时,ChatGPT风口还表现出其他的非典型特性。比如大语言模型技术对应的极高的资金、资源硬性门槛,以及日后持续性的投入,从根源上注定ChatGPT只能是巨头的专属游戏。清晰的门槛,决定了这不是随随便便就能上场的牌桌,炒...……更多
红米首批搭载骁龙8sgen3,支持100亿参数大模型
...,CPU主频是3.0GHz,根据官方的数据,其可支持100亿参数大模型,以及AI增强的GPU特性,大预言模型包括Baichuan-7B、GeminiNano、Llama2、ChatGLM等,可以为手机端侧大模型带来更好的表现。 ……更多
更多关于科技的资讯:
21.88万起 长城灵魂摩托正式上市:唯一国产8缸重机车
快科技10月26日消息,长城灵魂摩托SOUO H8正式上市,共推出三款车型,售价区间为21.88-28.88万元,其中最顶配为创始人版
2024-10-26 19:28:00
九大新功能!索尼A7M4升级Ver.4.00固件:传输史诗级增强
快科技10月26日消息,索尼向A7M4相机发布了Ver.4.00固件,连拍和传输功能都进行了升级。尤其是相机向手机或平板传输照片时
2024-10-26 19:28:00
小米15和澎湃OS 2发布会第一次彩排:雷军金凡合影
快科技10月26日消息,小米创办人雷军表示,小米15系列和澎湃OS 2发布会第一次彩排将在今晚举行,这次发布会内容非常丰富
2024-10-26 19:58:00
本文转自:人民网人民网记者 车柯蒙 王天乐10月25日晚,一场关于AI的奇幻之夜在人民网初心报告厅上演。《记者去哪儿》栏目接受人民网数字人白泽发出的邀请
2024-10-26 20:11:00
openai计划推出新型人工智能模型
近日,科技媒体透露,OpenAI计划于今年12月推出一款名为“Orion”的新型人工智能模型。这一模型被视为GPT-4的接班人
2024-10-26 20:33:00
华为nova13和nova13pro维修备件价格公布
10月25日,华为公布了其nova13和nova13Pro两款的维修备件价格。此外,华为还提供了非保修维修服务的收费标准
2024-10-26 20:34:00
问界m8外观设计专利图曝光
近日,赛力斯汽车有限公司在中国专利公布公告网上公布了一款SUV汽车的外观设计专利图。据业内人士和汽车博主分析,这款新车型极有可能为问界M8
2024-10-26 20:34:00
阿里达摩院开源新型ai工具——coi-agent
近日,阿里巴巴达摩院宣布开源一款新型AI工具——CoI-Agent,这款AI工具的核心功能是帮助科研人员快速生成科研想法
2024-10-26 20:35:00
高通骁龙8至尊版性能曝光
近日,据知名爆料博主透露,高通骁龙8至尊版移动端处理器还有一款“超高频版本”,其两个大核的频率高达4.57GHz,单核跑分达到3400
2024-10-26 20:35:00
小米15系列屏幕特性及显示性能详解
10月25日,小米昨日宣布将于10月29日晚上7点举办小米15系列及小米澎湃OS2新品发布会。今天,官方进一步详细阐述了小米15系列的屏幕特性及显示性能
2024-10-26 20:35:00
红魔10pro系列正式开启“7时代”
10月25日,红魔宣布其红魔10Pro系列,正式开启“7时代”。这一系列新机预计将配备7英寸的大屏幕,为用户带来更震撼的视觉体验
2024-10-26 20:36:00
galaxys25ultra颜色配置曝光
近日,据屏幕供应链公司透露,在S25系列中蓝色和绿色成为了常规配色。而在上一代的GalaxyS24系列中,这两种颜色仅为三星线上专属
2024-10-26 20:41:00
神舟十九号发射场区全系统合练:近日择机发射
10月26日消息,据媒体报道,今天,神十九发射场区展开全系统合练,检验各系统在发射流程当中的可靠性和安全性。此次合练从飞行准备
2024-10-26 20:58:00
启辰品牌技术开放日展示车电安全性优异性能
10月25日消息,前段时间,东风启辰举办了“启辰品牌技术开放日”,通过实车闯火廊、下车泡、底盘硬钢尖桩石柱等项目,展示了旗下车型在车电安全方面的优异性能
2024-10-26 21:05:00
卢伟冰晒小米15电池本体,容量超过了小米14 Pro
10月25日消息,卢伟冰提前晒出了小米15的电池本体,并且与小米14电池做了对比。从图上来看,新机电池的体积几乎完全没有变化
2024-10-26 21:07:00