• 我的订阅
  • 头条热搜
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...带队创办的AI2.0公司零一万物正式开源发布首款预训练大模型Yi-34B,模型开放商用申请,已在阿里云魔搭社区ModelScope首发。魔搭第一时间推出了模型部署相关教程,供开发者参考并快速上手。零一万物此次开源的Yi系列模型包含3...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!
...乎「配得上」这个体量?GPT-3.5只有200亿参数?今天,大模型圈都被微软论文中的一纸截图刷爆了,究竟是怎么回事?就在前几天,微软发表了篇论文并挂在了arXiv上,该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世,全世界大部分的注意力似乎都停留在一家公司,OpenAI。后...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
山海启航,云知声迈向AGI新征程
...据和应用场景的深厚积累,快速拥有了业内领先的通用大模型和行业大模型,又实现了大模型的规模化商业落地,成为业内为数不多的通用大模型和大规模商业化落地并举的公司。这是云知声全新的里程碑,标志着云知声正式踏...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位主办的智能科...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->Llama2->Yi,行业逐渐形成大模型的通用标准(就像做一个手机APP开发者,不会去自创iOS、Android 以外的全新基础架构)。01.AI.……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
科大讯飞举行星火认知大模型V3.5升级发布会。受访者供图华龙网讯(首席记者 董进)1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪,正式发布基于首个全国产算力训练的讯飞...……更多
林伟:大数据AI一体化的解读
今年是AI大爆发的一年,大语言模型的诞生推动了席卷整个行业的大模型热潮,许多人认为“AI的iPhone时代”到来了。训练大模型其实不简单,因为模型参数量的增加意味着需要更好的算力、更多的数据去锤炼,并且需要合适的...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型,并宣布全面开源。“源2.0”包括102B(1026亿)、51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...念股因此连续拉出三个涨停。这背后是由一款叫Kimi的大模型产品催化,其是国内大模型初创公司月之暗面发布的一款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...爆全球AI浪潮以来,AI圈子已经迅速走过了造出了通用大模型的第一道关卡,如今最关键的问题在于——如何让大模型高效地在实际应用场景中落地?百川智能的最新实践是:用大模型+增强技术,可以大大提升企业应用大模型的...……更多
观察|手机厂商“卷”大模型,人工智能会是下一个竞争赛道吗
手机厂商也加入了“大模型”赛道。11月1日,vivo在开发者大会上正式发布了自研通用大模型矩阵——蓝心大模型BlueLM,以及智能辅助应用“蓝心小V”和以公版App形式推出的自然语言对话机器人“蓝心千询”。科技公司不能错失...……更多
火出圈的Kimi,AI营销背后的产品逻辑
...竞争中,市场同质化严重,尤其在风口上的AI创投圈,大模型更不例外,大家都在晒参数,公布评测数据集,讲开源闭源,一顿猛如虎的操作,大众用户根本无法对某一个大模型留下特定的记忆,更别谈知道他们的优势了,最多...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
“华米OV”的新战场:手机大模型
...视觉中国文丨光锥智能,作者|刘俊宏,编辑丨王一粟大模型重塑一切的风,吹到了手机行业。在见识了大模型重塑IT基础设施、营销、办公、自动驾驶等行业后,深陷于手机行业销量和技术双周期“低谷”的手机厂商们,急迫...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
昆仑万维董事长方汉谈“开源模型落后”:和闭源的差距在缩小,不存在谁压倒谁
...方汉出品|搜狐科技作者|郑松毅4月17日,在“天工”大模型一周年之际,昆仑万维宣布,“天工3.0”基座大模型与“天工SkyMusic”音乐大模型正式开启公测。在媒体沟通会上,昆仑万维董事长兼CEO方汉介绍,“天工3.0”拥有4000...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...新闻网2023年4月17日,昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日,在“天工”大模型一周年之际,昆仑万维重磅宣布,“天工3.0”正式开启公测!“天工3.0”采用4千亿级参数MoE混合专家模型,并...……更多
更多关于科技的资讯:
标配天神之眼C!第二代比亚迪元PLUS智驾版3月5日上市:现款11.98万起
快科技3月2日消息,日前,比亚迪官方宣布第二代元PLUS智驾版将于3月5日正式上市。此次发布的新车最大亮点是有望全系标配天神之眼C-高阶智驾三目版(DiPilot 100)
2025-03-02 16:09:00
谷歌创始人要求员工每周工作60小时!努力才能赢得AGI对决
快科技3月2日消息,据媒体报道,谷歌联合创始人谢尔盖·布林(Sergey Brin)发布内部信,督促员工每周工作60小时
2025-03-02 16:09:00
NVIDIA首款Arm PC芯片首度现身跑分!成绩不太理想
快科技3月2日消息,英伟达与联发科合作开发的首款Arm架构PC芯片NVIDIA N1X的工程机现身Geekbench跑分平台
2025-03-02 16:09:00
柯洁成小米SU7 Ultra车主:53.39万元全款拿下
快科技3月2日消息,著名围棋棋手、世界冠军柯洁发微博称:“你们怎么知道我全款拿下小米SU7 Ultra啦”,并配上了付款记录
2025-03-02 16:09:00
多彩贵州网讯 在AI技术与政务场景深度融合的浪潮中,贵州省自然资源厅与贵州大数据集团携手交出创新答卷。基于国产大模型DeepSeek自主研发的智能政务辅助系统
2025-03-02 16:27:00
你的显卡中奖了吗 RTX 50系列缺失ROP性能损失最高11%!请玩家尽快检测(附方法)
快科技3月2日消息,RTX 5090(D)、RTX 5080、RTX 5070 Ti显卡缺失8个ROP单元的问题,已经得到了NVIDA官方的确认
2025-03-02 16:39:00
新加坡警方称已破获向DeepSeek走私英伟达GPU的主要团伙:并逮捕9人
2月27日,据广播公司亚洲新闻频道(Channel News Asia)报道,新加坡警方和海关当局在26日已指控三名男子涉嫌绕过美国贸易出口限制
2025-03-02 16:39:00
国产手机四大“夜神”来了:小米OPPOvivo华为狂卷夜景长焦 谁更强
快科技3月2日消息,小米15 Ultra发布之后,另外三大Ultra旗舰——OPPO Find X8 Ultra、vivo X200 Ultra
2025-03-02 17:09:00
河北新闻网讯(京敖轩)2月21日,2025年日本国际智慧能源周落下帷幕。晶澳科技携DeepBlue系列旗舰产品及两大场景化解决方案登场
2025-03-02 17:20:00
贵州日报“融媒蜂巢”战队启航!智媒时代的创新密码
3月2日,贵州日报智媒创建启动仪式暨天眼新闻7.0创优版上线仪式在贵阳举行。随着首批6支“融媒蜂巢”战队亮相,贵州日报开启了智慧媒体建设的“蜂群效应”时代
2025-03-02 17:35:00
清晰超乎想象!中国分辨率最高的商业遥感卫星全球开放
2月27日,中国航天科技集团的“中国四维新一代商业遥感卫星系统”迎来两位新成员,四维高景一号03、04星成功入轨,状态良好
2025-03-02 17:39:00
定位中大型SUV!上汽奥迪Q6限时优惠价发布:30.9万元起
快科技3月2日消息,日前,上汽奥迪宣布旗下中大型SUV——奥迪Q6开启限时优惠活动,全系优惠价为30.9万元起。但官方未公布活动截止时间
2025-03-02 17:39:00
新加坡抓了9个人!指其向中国DeepSeek倒卖NVIDIA GPU 可判20年
快科技3月2日消息,随着中国DeepSeek的突然崛起,美国似乎发现自己的AI GPU出口管制政策失效了,高度怀疑中国公司通过新加坡
2025-03-02 17:39:00
RTX 50系列莫名丢失8个ROP单元!CPU-Z发出公开警告
快科技3月2日消息,RTX 50系列已发布的三款显卡都出现了ROP单元莫名丢失8个的问题,最多会影响11%的游戏性能,但官方声称影响范围很小
2025-03-02 18:09:00
聚力建支点 夺取开门红丨十堰猛狮:投入智能设备 已完成产值5000万元
十堰广电讯(郧西融媒记者 王琴)一年春作首,万事行为先。时下,走进各企业,车间里都是“热气腾腾”的生产景象,工人们抢时间
2025-03-02 19:03:00