• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
林伟:大数据AI一体化的解读
今年是AI大爆发的一年,大语言模型的诞生推动了席卷整个行业的大模型热潮,许多人认为“AI的iPhone时代”到来了。训练大模型其实不简单,因为模型参数量的增加意味着需要更好的算力、更多的数据去锤炼,并且需要合适的...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,正式发布基于首个全国产算力训练的讯飞...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...念股因此连续拉出三个涨停。这背后是由一款叫Kimi的大模型产品催化,其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
火出圈的Kimi,AI营销背后的产品逻辑
...竞争中,市场同质化严重,尤其在风口上的AI创投圈,大模型更不例外,大家都在晒参数,公布评测数据集,讲开源闭源,一顿猛如虎的操作,大众用户根本无法对某一个大模型留下特定的记忆,更别谈知道他们的优势了,最多...……更多
“华米OV”的新战场:手机大模型
...视觉中国文丨光锥智能,作者|刘俊宏,编辑丨王一粟大模型重塑一切的风,吹到了手机行业。在见识了大模型重塑IT基础设施、营销、办公、自动驾驶等行业后,深陷于手机行业销量和技术双周期“低谷”的手机厂商们,急迫...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
昆仑万维董事长方汉谈“开源模型落后”:和闭源的差距在缩小,不存在谁压倒谁
...方汉出品|搜狐科技作者|郑松毅4月17日,在“天工”大模型一周年之际,昆仑万维宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测。在媒体沟通会上,昆仑万维董事长兼CEO方汉介绍,“天工3.0”拥有4000...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
更多关于科技的资讯:
AMD锐龙9000X3D缓存改为CCD之下:散热更佳、频率更高
快科技10月27日消息,AMD早就说锐龙9000X3D系列会带来真正的第二代3D缓存技术,那么到底有什么革命性的变化呢
2024-10-27 17:59:00
黄河流域最大水电站关键进展:转子吊装完成!
快科技10月27日消息,据报道,黄河流域中海拔最高且在建装机容量雄踞榜首的玛尔挡水电站,其标志性1号机组已成功完成转子吊装作业
2024-10-27 17:59:00
丰田传奇车型AE86重新复活:换装氢能源发动机
快科技10月27日消息,日前,丰田传奇车型AE86 H2 Concept在现代汽车与丰田汽车联合举办的“赛道嘉年华”中亮相
2024-10-27 18:29:00
轿车操控 SUV空间!全新进口奥迪A6大探险家版上市:起售价51.89万元
快科技10月27日消息,2024款新奥迪A6 Avant和Allroad大探险家版车型正式上市,售价分别为51.89万元和61
2024-10-27 18:29:00
Thermaltake发布CT 200系列风扇:无光/ARGB可选 线缆菊花链设计
快科技10月27日消息,Thermaltake自豪地推出了其最新一代的PWM风扇——CT 200系列,该系列精心设计了无光版与ARGB版
2024-10-27 18:59:00
天空:英超计划召开股东会议,讨论与EFL达成财务分配协议新提
10月26日讯天空体育报道,英超联赛计划于11月22日召开股东会议,讨论与EFL(英格兰足球联赛体系)达成新的财务分配协议提案
2024-10-27 19:01:00
一加13将于10月31日发布:搭载超级信号工程2.0
10月26日消息,一加13手机将于10月31日16:00发布,官方预热显示该机搭载超级信号工程2.0,对蓝牙、网络、信号等进行了优化
2024-10-27 19:11:00
匠心精耕二十年,爱可丁推出HMOs儿童奶粉,以强大创新力刷新
回首过往20年,中国奶粉市场风云变幻,发生了不少大事,安全、品牌、配方等相继成为消费者关注的焦点;国家监管政策频出,宏观调控
2024-10-27 19:53:00
辉山奶粉品牌力获权威认证,携十余项大奖载誉前行
岁末年终,各大奶粉品牌纷纷打响了年度营销收官之战。其中,营销声量贯穿2022年度的国民品牌辉山奶粉,近日来先后斩获人民网第十七届人民企业社会责任奖“年度案例奖”
2024-10-27 20:03:00
首届成人夜校行业论坛在西安成功举办,AI助力创新项目解决就业
2024年8月14日,由行人派夜校发起,首届成人夜校行业论坛在西安圆满落幕,多位省、市、高校、协会领导和全国各地的创业大咖齐聚一堂
2024-10-27 20:07:00
小明是位资深设计师,工作需要经常下载各种素材,从字体到图片,从模型到视频,都需要在浩瀚的网络资源中寻找。以往,他都是通过各种搜索
2024-10-27 20:10:00
北京有一趟仅仅4节车厢的粉色动车:周末特别火
秋高气爽,赏秋好时节。如果你身在北京,建议体验一下穿梭在北京怀柔与密云之间的“怀密号”,它使用的是CRH6F-A型电力动车组
2024-10-27 20:29:00
真的要涨价!小米15内存起步就有12GB
10月29日周二晚上19点,小米将举办小米15系列暨小米澎湃OS 2新品发布会,堪称又一次科技届的“春晚”,雷军也提前回答了有关此次发布会大家最关心的几个问题
2024-10-27 20:29:00
国际领先!我国750千伏电缆系统顺利通过鉴定
快科技10月27日消息,据报道,中国三峡建工(集团)有限公司——隶属于三峡集团,携手青岛汉缆股份有限公司、长缆科技集团股份有限公司及中国电力科学研究院有限公司等顶尖企业
2024-10-27 21:29:00
内存超频疯了!芝奇、金士顿双双超过12GHz
快科技10月27日消息,随着酷睿Ultra 200K系列的发布、CUDIMM DDR5的陆续登场,内存超频再次迎来一波高潮
2024-10-27 21:29:00