• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,正式发布基于首个全国产算力训练的讯飞...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
林伟:大数据AI一体化的解读
今年是AI大爆发的一年,大语言模型的诞生推动了席卷整个行业的大模型热潮,许多人认为“AI的iPhone时代”到来了。训练大模型其实不简单,因为模型参数量的增加意味着需要更好的算力、更多的数据去锤炼,并且需要合适的...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...念股因此连续拉出三个涨停。这背后是由一款叫Kimi的大模型产品催化,其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
火出圈的Kimi,AI营销背后的产品逻辑
...竞争中,市场同质化严重,尤其在风口上的AI创投圈,大模型更不例外,大家都在晒参数,公布评测数据集,讲开源闭源,一顿猛如虎的操作,大众用户根本无法对某一个大模型留下特定的记忆,更别谈知道他们的优势了,最多...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
“华米OV”的新战场:手机大模型
...视觉中国文丨光锥智能,作者|刘俊宏,编辑丨王一粟大模型重塑一切的风,吹到了手机行业。在见识了大模型重塑IT基础设施、营销、办公、自动驾驶等行业后,深陷于手机行业销量和技术双周期“低谷”的手机厂商们,急迫...……更多
昆仑万维董事长方汉谈“开源模型落后”:和闭源的差距在缩小,不存在谁压倒谁
...方汉出品|搜狐科技作者|郑松毅4月17日,在“天工”大模型一周年之际,昆仑万维宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测。在媒体沟通会上,昆仑万维董事长兼CEO方汉介绍,“天工3.0”拥有4000...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
更多关于科技的资讯:
第九届全国青少年无人机大赛(湖北省赛)在十堰开赛
十堰广电讯(全媒体记者 周贤林 通讯员 柯栋)6月14日,第九届全国青少年无人机大赛(湖北省赛)在十堰开赛。本次大赛以“逐梦空天星时代
2025-06-14 14:07:00
圣奥芝加哥展厅盛大启幕,深化全球布局彰显“智造”实力
在北美办公家具界的盛事——美国芝加哥NeoCon展期间,国内办公家具领军品牌圣奥迈出了其全球化战略的关键步伐。当地时间6月9日
2025-06-14 15:59:00
重磅!ATFX与渣打银行建立合作关系
屡登行业头条的ATFX传来了一个重磅消息。2025年6月11日,ATFX旗下机构业务平台ATFX Connect正式宣布
2025-06-14 16:02:00
新希望乳业2025投资者大会:发展核心品类,构建增长动能
6月10日,成都中国天府农业博览园内,“以鲜为美,质领未来”新希望乳业2025年投资者大会拉开序幕。作为新希望乳业高质量增长的动力之一
2025-06-14 16:02:00
南报网讯(记者曹丽珍)为高考“让路”而短暂休战的2025年江苏省城市足球联赛(即“苏超”),这个周末将重燃战火。与此同时
2025-06-14 08:06:00
近日,国家知识产权局发布第25届中国专利奖授奖情况,宁波揽获金奖2项、优秀奖8项,其中宁波智能装备研究院有限公司和浙江极氪智能科技有限公司(第二权利人)分获“中国专利金奖”和“中国外观设计金奖”
2025-06-14 09:08:00
蓬莱-长岛无人机跨海运输场景首航验证试飞成功
齐鲁晚报·齐鲁壹点 闫丽君从烟台交通集团获悉,6月12日,在省市有关方面大力支持下,烟台低空经济发展有限公司联合中国邮政集团和壹通无人机
2025-06-14 09:19:00
截至5月24日,由中石化石油工程设计有限公司自主研发的高频聚结分离器,已经在埕岛油田中心三号平台平稳运行170天,成功将其日分水能力由1
2025-06-14 09:19:00
厦门网讯(厦门日报记者 林露虹)昨日,第四届厦门5G应用大赛颁奖活动在集美举行,27个获奖项目揭晓。现场同步举办5G应用交流会
2025-06-14 09:50:00
雄安国际金融科技创新技术应用大赛决赛举行58项金融科技创新技术精准适配产业新场景6月12日至13日,雄安国际金融科技创新技术应用大赛决赛在雄安新区场景汇科创园举行
2025-06-14 08:06:00
刘晓霞 河南省新郑市档案馆摘要:本文以机关事业单位人事档案管理为研究对象,结合信息化时代发展需求,系统分析传统档案管理模式的局限性
2025-06-14 05:58:00
司光宇 对外经济贸易大学商学院摘要:在人工智能、数字化转型的强劲助力下,传统的企业人力资源培训正面临着前所未有的冲击。因此
2025-06-14 05:59:00
李国庆发文:财产分割已达成最终和解,积极布局AI应用
6月13日,当当创始人李国庆发文称:我和俞渝女士已于2023年解除了婚姻关系。近日,双方就相关财产分割也已达成最终和解
2025-06-13 17:06:00
走在最前沿|小小钻夹头,何以成冠军
齐鲁晚报·齐鲁壹点记者 周国芳 闫聪 王世宇在山东威海临港区蔄山镇,有这样一家企业——山东威达机械股份有限公司。如今,博世
2025-06-13 17:07:00
腾讯2026青云计划启动,百余项技术课题支持青年人才挑大梁
人才是创新发展的根基。6月12日,腾讯2026“青云计划”正式启动,在全球范围内招募一批顶尖技术学生,通过提供行业顶级的师资力量
2025-06-13 17:08:00