• 我的订阅
  • 头条热搜
Databricks推出目前最强开源 AI
3月31日消息,Databricks近日在推出了一款通用大语言模型DBRX,号称是“目前最强开源AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。从官方新闻稿中得知,DBRX是一个基于Transformer的大语言模型,采用MoE(Mixture...……更多
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
【新智元导读】NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。文本...……更多
英伟达h100gpu再创多项新纪录
...推出了新的测试项目,专门针对微调(Fine-tuning)大语言模型和图神经网络(GNN),而英伟达H100创下了多项纪录。Fine-tuning是指在预训练模型的基础上,通过在特定任务上进行额外的训练来调整模型的参数,以使其更好地适应该...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...0%的Triton内核Pytorch最近发表了一篇技术博客,他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例,100%使用Triton内核实现了FP16推理。Granite-8B Code是由IBM开发的一种仅限解码器的代码模型,专为代码生成任务设计。仓库地址:……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
疯狂一夜!美国AMD、谷歌纷纷亮出大杀器,人类迎来巨变前夜?|钛媒体焦点
...迄今为止功能最强大、最通用的多模态人工智能(AI)大模型:Gemini(中文称“双子座”)。具体来看,谷歌最新发布的Gemini 1.0系列,主要是英语模型,共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将...……更多
英伟达h100gpu在mlperf基准测试创造6项新记录
...PT-3的大规模基准测试。MLPerfLLM基准测试是基于OpenAI的GPT-3模型进行的,包含1750亿个参数。LambdaLabs估计,训练这样一个大模型需要大约3.14E23FLOPS的计算量。英伟达最新的EosAI超级计算机配备了 10752 个H100TensorCoreGPU和N……更多
11月23日,InflectionAI发布了全球第二代大语言模型(LLM)Inflection-2,据其官方宣称,该模型仅次于OpenAI的GPT-4。Inflection-2在5000块英伟达H100GPU上进行FP8混合精度训练,具备约10^25次FLOP计算能力。与谷歌的PaLM2Large……更多
突发!谷歌发布史上最强大模型Gemini,打爆GPT-4
...在谷歌官网联名发文,宣布推出这一万众瞩目的多模态大模型。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。具体来说,此次谷歌一共带来了Gemini的三个版本:Gemini Ultra:谷歌最大、最强模型,适用于高度复...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
...越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内部存在深刻分歧,世界各国政府采取的做法相互矛盾。挑战性在...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...过。但是,也需要说明这些测试存在局限:仅使用了一种模型,即来自 Meta 的 Llama 2 70B。希望未来能看到这些测试中使用更多不同的 AI 模型。对 MI300X 及 AMD 未来的 GPU 来说,这个结果很是不错。但到今年年底时,考虑到英伟达 B...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
「世界开源新王」跌落神坛?重测跑分暴跌实锤造假,2人团队光速「滑跪」
...后,开发者们甚至还发现,Reflection可能就是个「套壳」模型,而且还是连套三家的那种(Claude/GPT/Llama)。这下子,Reddit和X等平台上,立刻掀起了质疑的声浪。 左右滑动查看为此,Shumer承诺将和Glaive创始人Sahil Chaudhary一起调查...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和...……更多
英伟达发布mistral-nemoai大语言模型
...国初创公司MistralAI,今天发布了全新的Mistral-NeMoAI大语言模型,拥有120亿个参数,上下文窗口(AI模型一次能够处理的最大Token数量)为12.8万个token。VentureBeat与Midjourney合作制作Mistral-NeMoAI大模型主要面向企业环境,让企……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...多款重磅明星产品,目前市面上能叫得上名字得人工智能模型几乎都是在该架构上进行训练,行业内“一芯难求”的局面迟迟得不到缓解。而今年,按照英伟达每两年更新一次GPU架构的节奏,大家都对英伟达新一代计算平台翘首...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research、Google DeepMind 和 Google Cloud 共同推出了一个更小、更快、更强大的视觉语言模型(VLM)——PaLI-3,该模型与相似的体...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...理。国内新闻字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种...……更多
微软发布旗下最小语言模型phi-2
...会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型Phi-2,共有27亿参数,相比较此前版本有明显提升。注:微软于今年6月发布Phi-1,只有13亿代码,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...所未有的速度加速,继 Meta 昨天推出其新的开源 Llama 3.1 模型之后,法国 AI 初创公司 Mistral AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理...……更多
影响英伟达根本逻辑的大争论:OpenAI改变策略意味着什么?谁在撒谎?
大模型预训练“缩放定律”定律失效?模型推理成“解药”,英伟达一家独大格局要变天?“缩放定律”指导下,AI大模型预训练目前遭遇瓶颈。据路透12日报道,硅谷主要AI实验室的新模型训练计划目前普遍进展不顺,新模型...……更多
不光鸡生蛋、蛋也能生鸡?英伟达正测试用生成式AI来帮助研发芯片
...需要大量算力的支持,而英伟达的尖端AI芯片则是大语言模型(LLM)开发的首选,几乎垄断了全球算力。那么,如果说尖端AI芯片这只“鸡”,诞生下了生成式AI这只火爆全球的“蛋”。未来这只愈发成熟的“蛋”,是否也有可能...……更多
RTX 40系GPU AI性能首测
...把玩家输入的语音转化为文字,然后上传至云端的大语言模型给出对应的对话回复,接着在云端把这答复转换为语音回传本地,在本地利用NVIDIAAudio2Face为游戏角色创建脸部表情动画,让嘴型对得上声音,最后通过游戏引擎输出...……更多
更多关于科技的资讯:
尴尬:美国情侣玩捉迷藏 男子被女友关行李箱致死引围观
12月8日消息,近日,美国佛罗里达州47岁女子女子萨拉·布恩(Sarah Boone)因谋杀罪被判终身监禁,她要求重新审判被拒
2024-12-08 07:11:00
雷军回应小米被指贴牌没技术:小米一致高度重视制造
快科技12月8日消息,日前,小米CEO雷军发视频回应小米被误解没有工厂、没有技术,被指贴牌。雷军称小米刚开始的模式是轻模式+代工模式的组合
2024-12-08 07:11:00
不为钱放弃生活!专家:印尼越南打工人不愿加班 中国企业要适应当地文化
12月8日消息,大华银行印尼副总裁谢思元近日接受采访时表示,印尼很多朋友不愿意加班,中国企业需要适应当地文化。“印尼很多朋友不愿意加班
2024-12-08 07:11:00
最高补贴1万元!贵州发消费券 60岁及以上老人半价买华为、小米、苹果手表
快科技12月8日消息,据贵州省民政厅网站,日前,贵州省民政厅正式开启发放居家适老化改造消费券,凡收货地址在贵州省境内的60周岁及以上老年人(1964年12月31日及以前出生)
2024-12-08 07:41:00
2024第三十届天津国际珠宝展吸引市民参观、选购 扫码阅读手机版
在天津梅江会展中心举办的2024第三十届天津国际珠宝展,吸引市民参观、选购。
2024-12-08 08:36:00
李云飞:有同行要给被比亚迪起诉的黑媒体兜底赔偿 我们的索赔谁也兜不住
快科技12月8日消息,比亚迪集团-品牌及公关处总经理李云飞今日发布视频称,比亚迪接受媒体的批评和监督,但对黑公关和黑媒体
2024-12-08 08:41:00
实探国补扩容下的3C市场:门店排队购机潮久违再现 消费电子迎暖冬
“江苏这次3C数码补贴后价格诱人引发抢购和代购。”据知情人士透露,有消费者甚至从凌晨开始排队,紧俏产品动辄排队一小时以上
2024-12-08 08:41:00
美国宇航员瘦到脱相 究竟该怪谁
大伙们还记得滞留太空的两位宇航员不?因为波音的拉胯,原本 8 天的航天任务,直接变成了 8 个月的太空 “ 隔离 ”
2024-12-08 09:11:00
曝哪吒汽车拟改名为“方舟汽车”:直接用创始人名字当车名
快科技12月8日消息,日前,有多位博主转发了一则网传的“关于哪吒汽车内部讨论拟改名为‘方舟汽车’的初步方案”邮件截图,引起网友热议
2024-12-08 09:11:00
爱奇艺涉嫌虚假宣传:“尖叫之夜”活动提示抽中门票 实际无法兑奖
快科技12月8日讯,根据国内媒体报道:据多名网友反映,称自己在爱奇艺举办的“尖叫之夜”活动抽奖环节遭遇问题。据称,他们在活动页面上成功抽中了门票
2024-12-08 09:11:00
一年掏十亿打广告 香飘飘比你想的滋润多了
“ 一年卖出 10 亿杯,杯子连起来可以绕地球两圈。 ” “ 连续五年全国销量领先 ” 、 “ 杯装奶茶开创者,一年卖出 3 亿多杯
2024-12-08 09:11:00
特斯拉回应合肥一门店排队刷卡买车:属实 首付5.6万就能开走新车
快科技12月8日消息,据报道,网友近日发布的视频显示,合肥特斯拉某门店出现了排队刷卡买车的现象。原因是合肥在11月底加码汽车购车补贴
2024-12-08 09:41:00
业界首次!中国联通AI大模型存算分离技术新突破
快科技12月8日消息,中国联通宣布,中国联通研究院日前与浙江联通、联通服装制造军团协同攻关,针对AI敏感数据的本地存储异地训练需求提出了创新的业务模式
2024-12-08 09:41:00
前暴雪负责人指责《漫威争锋》抄袭
暴雪前总裁Mike Ybarra在社交平台发帖称,网易的《漫威争锋》应该叫做《守望先锋:漫威争锋》,再次上演《荒野起源
2024-12-08 09:41:00
□南京日报/紫金山新闻记者 黄琳燕12月9日至12日,“亚马逊全球开店跨境峰会”这一跨境电商行业的年度盛会将首次落地南京
2024-12-08 09:58:00