• 我的订阅
  • 头条热搜
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
轻量级的模型亦有其存在的市场空间。2022年11月底,基于GPT-3.5的ChatGPT刚出来的时候,小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌给ChatGPT抛出一个问题:证明一下勾股定理。最终,ChatGPT给出了一个基于数学归...……更多
华人团队爆火instructblip抢跑看图聊天
碾压GPT-4识图能力的多模态生成模型来了。华人团队最新提出的InstructBLIP在多项任务上实现SOTA。GPT-4看图聊天还没上线,就已经被超越了。近来,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。BLIP家族...……更多
infini-attention:谷歌大内存机制
...歌大改Transformer,“无限”长度上下文来了。现在,1B大模型上下文长度可扩展到1M(100万token,大约相当于10部小说),并能完成Passkey检索任务。8B大模型在500K上下文长度的书籍摘要任务中,拿下最新SOTA。这就是谷歌最新提出的...……更多
chatgpt低成本复现流程开源
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需1.62GB显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch,单机训练速度最高...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多
chatgpt低成本复现流程来了
首个开源的ChatGPT低成本复现流程来了!预训练、奖励模型训练、强化学习训练,一次性打通。最小demo训练流程仅需 1.62GB 显存,随便一张消费级显卡都能满足了。单卡模型容量最多提升 10.3倍。相比原生PyTorch,单机训练速度最...……更多
垂直大模型竞争,能突破数据“卡点”吗?
AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
oppo首个端侧应用70亿参数大模型findx7系列
...的首个听筒/免提双模卫星通话,首个端侧应用70亿参数大模型,首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列,为2024年旗舰手机树立全新的技术标杆,并为消费者带来刷新...……更多
OPPO首个AI大模型!安第斯大模型AndesGPT发布
...举行了FindX7系列技术沟通会,在这次会议上,OPPO首个AI大模型——安第斯大模型AndesGPT正式发布。据官方介绍,AndesGPT具备功能全面、强大的生成式视觉模型,能够对图像进行精准语义理解,并在此基础上实现了对超过120类主体...……更多
...昨天获悉,复旦大学自然语言处理实验室开发的新版MOSS模型已上线,成为国内首个插件增强的开源对话语言模型,支持搜索引擎、图像生成、计算器、方程求解器等插件工具。目前,相关代码、数据、模型参数已在Github、Hugging ...……更多
oppofindx系列三大技术突破
...方面。首先介绍的的是近期大热的AI,OPPO首个自助训练大模型平台——安第斯大模型正式亮相。据悉,全新的AndesGPT首次应用70亿参数的大模型,相比10亿大模型,同时更大的模型数据量,在AI处理的能力方面会更好,并且这次大...……更多
中科创达:已率先发布端侧运行130亿参数模型 【中科创达:已率先发布端侧运行130亿参数模型】财联社12月11日电,中科创达接受调研时表示,公司已经率先发布端侧运行130亿参数模型。充分利用模型压缩、分布式以及张量并行...……更多
多模态大模型是当下很火的一种创新技术,加快对多模态大模型技术的布局,可进一步提高金融服务效率,缓解行业发展困境。为了攻克创新技术领域的难题,度小满联合哈尔滨工业大学共同研发出一种创新的自适应剪枝算法...……更多
亚马逊开发史上最大文本转语音模型
...能研究团队宣布开发了一个据称是史上最大的文本转语音模型,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...受瞩目的热门话题。在若愚科技CEO孙腾看来,机器人是大模型最理想的落地载体和应用平台,大模型的引入彻底改变了机器人仅能在单一场景下执行单一任务的困境,使机器人智能化水平显著提升,变得更聪明,能够承担更复杂...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
谷歌没开源的 PaLM,网友给开源了
...了。昨天,一位开发者在GitHub上开源了三种微缩版的PaLM模型:参数分别为1.5亿(PalM-150m),4.1亿(PalM-410m)和10亿(PalM-1b)。项目地址:https://github.com/ conceptofmind/PaLM这三种模型在谷歌C4数据集进行了训练,上……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?
...知识图谱到机器学习,再到深度学习,以及直到今天的大模型阶段。每一次技术跃迁的时间虽然在缩短,但仍然是一个需要前期积累、长期投入的过程。自动驾驶,这个被誉为人工智能王冠上的明珠,正是随着2012年深度学习技...……更多
开源狂潮让巨头惨败,谷歌内部文件曝光
...的LLMs:在Pixel6上,以每秒5个token的速度,就能运行基础模型。可扩展的个人AI:只要一个晚上,就能在笔记本电脑上微调出一个个性化AI。负责任的发布:这一点倒是没有「解决」,说「避免」会更贴切。现在网上到处都是充满...……更多
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...款基于AI的自然语言处理工具。ChatGPT使用的人类反馈强化模型技术使用人类偏好作为奖励信号来微调模型,能够通过学习和理解人类的语言进行对话,像人类一样聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
融资超25亿元,他们的目标和OpenAI很像
...会(CNCC2023)上,智谱AI推出了自主研发的第三代基座大模型ChatGLM3及相关系列产品。公开消息显示,目前智谱AI的估值已超100亿元,最高或达150亿元。作为一家2019年成立的公司,智谱AI是如何从国内诸多的大模型公司中成功突围...……更多
没有这些,别妄谈做 ChatGPT 了
...在用行动来表明战斗力,比如前些天复旦大学推出的 MOSS 模型,一经开放试用,便冲上热搜。一时间眼花缭乱,让人生疑。有钱就能训出模型?以美团大佬带资入组为代表,很多创业者和投资人盯上了 ChatGPT,作为一个 NLPer,我...……更多
GPT-4震惊四座,中国创业者激战“小模型” | Future
...【Future】。发布ChatGPT仅三个多月后,OpenAI亲手为这场大模型热潮再添了把柴火。北京时间3月15日凌晨,OpenAI在官网上宣告了多模态大模型GPT4的诞生。优化了模型可支持的输入模态、文本长度等性能之外,OpenAI在GPT-4的基础上升...……更多
Chat AI项目丨对标DeepMind Gato,人工智能模型「DB1」已在多领域落地验证
作者丨吴思瑾编辑丨王与桐*大语言模型的火爆已经不必多言。在爆发的同时,越来越多其他领域的大模型也开始出现在聚光灯下。36氪近期接触到一家人工智能模型公司「谜题科技」,聚焦在决策智能领域,于2022年12月发布推...……更多
更多关于科技的资讯:
本文转自:合肥晚报5月22日,合肥本土企业科大讯飞宣布,讯飞星火API能力正式免费开放。其中,讯飞星火Lite API永久免费开放
2024-05-24 00:15:00
本文转自:平顶山日报建行平顶山分行:消费升级 月月有礼本报讯 (记者张超)5月23日,从建行平顶山分行传来消息,即日起至6月30日
2024-05-24 01:49:00
本文转自:成都日报又一专业会议中心投用成都再添集成电路产业人才技术交流平台本报讯 (成都日报锦观新闻记者 吴怡霏) 5月23日
2024-05-24 02:36:00
倍益康携运动康复科技新品亮相体博会
本文转自:华西都市报倍益康携运动康复科技新品亮相2024中国体博会。雷远东摄国家体育总局经济司司长杨雪鸫(左一)在倍益康展位参观
2024-05-24 02:55:00
本文转自:福州晚报福州晚报讯 昨日,2024华为产业数智创新生态大会在榕举行。大会集结了各界行业精英,共同见证了AI技术的最新突破
2024-05-24 03:14:00
“新疆包邮”后网购消费起势迅猛
本文转自:乌鲁木齐晚报6·18电商大促开卖三日,天猫平台新疆销售额同比增长140%“新疆包邮”后网购消费起势迅猛6·18大促前夕
2024-05-24 03:16:00
本文转自:福州晚报福州晚报讯 昨日,第七届数字中国建设峰会现场体验区——香港馆正式开馆。这是香港特别行政区政府驻福建联络处首次在数字中国建设峰会现场体验区参展
2024-05-24 03:16:00
谷歌调整“隐藏ip地址”选项提高用户安全性
5月23日消息,谷歌今年2月在Canary频道Chrome浏览器版本中,“设置”>“隐私和安全”>“跟踪保护”路径下引入了“隐藏IP地址”选项
2024-05-24 00:04:00
特斯拉推出cybervessel水杯,中国官网暂未上架
5月23日消息,受Cybertruck启发,特斯拉推出了一款Cybervessel水杯,美国官网显示为50美元(IT之家备注
2024-05-24 01:22:00
5月23日,哔哩哔哩(以下简称“B站”)公布了截至2024年3月31日的第一季度未经审计的财务报告。第一季度,B站总营收同比增长12%
2024-05-24 00:12:00
在黄浦江畔实现梦想
本文转自:人民日报海外版范宇斌《 人民日报海外版 》( 2024年05月24日 第 11 版)赵鹤鸣在制作咖啡。谢晨近照
2024-05-24 04:36:00
本文转自:长江日报两家生物科技企业亟须技术攻关“天网”搭台快速找到合作方长江日报讯 近日,湖北科创供应链“天网”平台用户美益添生物医药(武汉)有限公司(以下简称“美益添”)通过“天网”平台的撮合
2024-05-24 04:36:00
本文转自:赣南日报本报讯 (记者温居林 通讯员刘扬)“进入5月份后,公司的泳装销售迎来了快速增长。”近日,合隆制衣(全南)有限公司关务经理刘高翔说
2024-05-24 05:08:00
本文转自:内蒙古日报 □本报记者 蔡冬梅九原区融媒体中心记者 徐昕国内最大的“黑灯实验室”日前在包头市九原区投入试运行
2024-05-24 05:18:00
本文转自:重庆日报现场发布两份清单各涉及100项成果达成意向合作金额超20亿元本报讯 (新重庆-重庆日报记者 佘振芳)5月23日下午
2024-05-24 05:21:00