• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
林伟:大数据AI一体化的解读
今年是AI大爆发的一年,大语言模型的诞生推动了席卷整个行业的大模型热潮,许多人认为“AI的iPhone时代”到来了。训练大模型其实不简单,因为模型参数量的增加意味着需要更好的算力、更多的数据去锤炼,并且需要合适的...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,正式发布基于首个全国产算力训练的讯飞...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...念股因此连续拉出三个涨停。这背后是由一款叫Kimi的大模型产品催化,其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
火出圈的Kimi,AI营销背后的产品逻辑
...竞争中,市场同质化严重,尤其在风口上的AI创投圈,大模型更不例外,大家都在晒参数,公布评测数据集,讲开源闭源,一顿猛如虎的操作,大众用户根本无法对某一个大模型留下特定的记忆,更别谈知道他们的优势了,最多...……更多
“华米OV”的新战场:手机大模型
...视觉中国文丨光锥智能,作者|刘俊宏,编辑丨王一粟大模型重塑一切的风,吹到了手机行业。在见识了大模型重塑IT基础设施、营销、办公、自动驾驶等行业后,深陷于手机行业销量和技术双周期“低谷”的手机厂商们,急迫...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
昆仑万维董事长方汉谈“开源模型落后”:和闭源的差距在缩小,不存在谁压倒谁
...方汉出品|搜狐科技作者|郑松毅4月17日,在“天工”大模型一周年之际,昆仑万维宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测。在媒体沟通会上,昆仑万维董事长兼CEO方汉介绍,“天工3.0”拥有4000...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
更多关于科技的资讯:
日本拟要求自动档新车安装防误踩油门装置:踩错踏板也不会跑
快科技7月8日消息,据报道,日本国土交通省预计将在晚些时候更改相关法规,要求新型号自动档汽车必须安装防错踩装置,并逐渐推广至现有型号的新车上
2024-07-08 20:09:00
创造无数人的饭碗!Java之父James Gosling宣布正式退休
快科技7月8日消息,编程语言Java的创始人,被誉为“Java之父”的James Gosling,近日在社交媒体上宣布了自己正式退休的消息
2024-07-08 20:09:00
女子长期喝通便茶:肠道长满豹纹
7月8日消息,据媒体报道,一53岁女子有4年便秘史,长期喝网上推荐的通便茶。经诊断,这名女子的肠壁长满"豹纹",形成了“结肠黑变病”
2024-07-08 20:39:00
寂寞的中东土豪 成了中国公司的金矿
如果你问一个在沙特呆过的中国人最不适应什么?他的答案可能不是缺乏绿叶菜的食物,也不是复杂饶舌的阿拉伯语,而多会是一句略显无奈的感叹
2024-07-08 20:39:00
苹果AI限制老机型!曝苹果上调iPhone 16系列备货量至9000万部
快科技7月8日消息,距离苹果9月的秋季新品发布会只剩两个多月,关于iPhone 16的爆料也逐渐多了起来。今日有媒体报道
2024-07-08 20:39:00
加速布局充电网络!理想汽车新增5座超充站 累计已达619座
快科技7月8日消息,理想汽车于2024年第27周(7月1日至7月7日)新增5座超充站。据悉,这五座超充站分别位于宁波、深圳
2024-07-08 21:09:00
女子睡凉席醒来发现腿上长满红斑 医生提醒:陈年凉席有千万只螨虫
快科技7月8日消息,据媒体报道,家住湖南省长沙市的李女士饱受皮肤问题困扰。原来,在一周前,李女士早上睡觉起来后发现,自己的双下肢莫名其妙起了大量红斑
2024-07-08 21:09:00
官方泄密!腾讯视频有意推出无广告版本:要付费、视觉升级
快科技7月8日消息,近日,腾讯视频开启官方调研,有意推出无广告的高端版本,你支持这样的操作吗?从这份官方调研的报告可以清楚的看到
2024-07-08 21:09:00
高通+AMD在PC端接连放大招!英特尔坐不住了
移动端处理器在这五年的时间里发生了前所未有的改变,从英特尔占据绝对话语权到AMD锐龙处理器强势登陆移动端并站稳脚跟,再到苹果宣布自家Mac产品线不再使用英特尔处理器而改用自研M系芯片
2024-07-08 21:09:00
CPT Markets塞浦路斯办事处盛大开幕!
跨越巅峰,耀世启航!CPTMarkets塞浦路斯办事处盛大开幕!作为一家全球领先的国际金融衍生品及相关服务供货商,CPTMarkets始终紧跟时代步伐
2024-07-08 21:15:00
亿康源精英盛宴暨亿康源启动成功举办
(本台记者报)2024年7月7日下午,亿康源精英盛宴暨启动仪式在杭州市中维歌德大酒店盛大举行。此次盛会不仅吸引了行业内的专业人才
2024-07-08 21:15:00
在餐饮界,每一个万店连锁品牌,都是品类“灯塔”般的存在。而在这其中,有一颗璀璨的明珠,它努力多年,不仅点亮了自身的光芒
2024-07-08 21:16:00
羊小咩加码,羊小咩购物能否取现“再起波澜”
羊小咩电商近日加码即时零售赛道,预计最快将于7月14日正式上线即时零售服务。这一举措是在放弃外卖战场后,将战略重心转向即时零售的表现
2024-07-08 21:17:00
为华为云数据中心再添供电引擎 贵安供电局首次采用远方遥控操作进行主变投运
7月6日凌晨,随着贵安调控“远方一键顺控”操作指令送达,110千伏磊庄变3号主变成功投运。这是贵安供电局首次采用远方遥控操作投运110千伏电压等级的主变压器
2024-07-08 21:21:00
人死后指纹还能解锁手机吗 网友:不能了 冬天室外冻手解锁不了
快科技7月8日消息,微博话题“人死后指纹还能解锁手机吗”冲上热搜榜,引发热议。在评论区,不少网友认为,人死后指纹不能解锁手机
2024-07-08 21:39:00