• 我的订阅
  • 头条热搜
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和产业竞争的新焦点。然而,目前缺少一篇能够全面解析具身智能发展现状的综述。因此,鹏城实验室多智能体...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
12月6日夜间,谷歌发布了其最新一代的AI大模型Gemini。谷歌的印度籍CEO Sundar Pichai亲自为这项发布站台,在公开信中将Gemini描述为:“我们迄今为止最强大、最通用的模型,它在许多领先的基准测试中都展现出了最先进的性能。...……更多
苹果公司公布“mm1”多模态大模型
...dalLLMPre-training》的论文,其中介绍了一款“MM1”多模态大模型,该模型提供30亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首次对...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
苹果最新杀入开源大模型战场,而且比其他公司更开放。推出7B模型,不仅效果与Llama 3 8B相当,而且一次性开源了全部训练过程和资源。要知道,不久前Nature杂志编辑Elizabeth Gibney还撰文批评:许多声称开源的AI模型,实际上在...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...直在进行深入研究。采用了新一代的 Transformer 人脸表征模型 TransFace 后,FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作,FaceChain-FACT。继 TransFace 之后,FaceChain 团队最近被机器学习顶级国际会议 NeurI……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
【新智元导读】小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。小模型的战场,打起来了!继GPT-4o mini、Mistral Ne……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...算机系媒体所的二年级博士生,主要研究方向是多模态大模型与视频理解 ,在 NeurIPS 、ACM Multimedia 等顶级会议发表多篇论文,曾获国家奖学金、北京市优秀本科毕业生等。视频内容的快速增长给视频检索技术,特别是细粒度视...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
AI技术为安全治理提供“新工具箱”
...置等都更好更精准。”AI安全风险主要分三类2023年,AI大模型安全风险凸显。AI技术在带来强有力的新工具的同时,也带来数据隐私、技术滥用、失控等安全问题。“加强对AI这一新兴技术的潜在风险研判和防范,确保AI安全、可...……更多
ChatGPT接连宕机影响有多大
...户提问。几个小时后,OpenAI宣布问题已经解决。随着AI大模型技术的突飞猛进,如ChatGPT这样的产品已经作为工作和生活助手服务数以亿计的用户。在这一趋势下,ChatGPT及其他大模型产品在过去一年时间内多次发生故障,也让业...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群,——还...……更多
碾压所有对手?谷歌发布轻量化开源大模型,笔记本电脑就可跑
开源大模型赛道迎来重磅新品。当地时间2月21日,谷歌宣布正式推出全新的开源大语言模型(LLM)“Gemma”, 旨在帮助开发人员和研究人员负责任地构建人工智能。据介绍,Gemma大模型与谷歌规模最大、能力最强的人工智能模型...……更多
openai发布多语言大规模多任务语言理解
...言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强大的多语言和多任务数据集,来评估大型语言模型(LL...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...为什么不使用MoE架构?后训练与RLHF流程是如何进行的?模型评估是如何进行的?我们什么时候可以见到Llama 4?Meta是否会发展agent?恰逢Llama 3.1刚刚发布,Meta科学家就现身播客节目Latent Space,秉持着开源分享的精神,对以上问题...……更多
...趋势。物理层安全技术架构体系包括物理层安全传输技术模型和物理层身份认证技术模型。物理层安全传输技术的基本原理是利用主信道和窃听信道之间的差异设计发送信号,使合法用户可以正确接收解调,而窃听者难以恢复接...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
开源社区分水岭:Meta大模型Llama 3发布,参数最高或达4000亿
为了保持公司在AI(人工智能)开源大模型领域的地位,社交巨头Meta推出了旗下最新开源模型。当地时间4月18日,Meta在官网上宣布公布了旗下最新大模型Llama 3。目前,Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本,...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...改进的智能体系统铺平了道路。「法官」智能体,击败大模型现有评估方法,无法为智能体系统的中间任务解决阶段,提供足够的反馈。另一方面,通过人工进行更好的评估,代价太大。而智能体系统的思考方式,更像人类,通...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
什么是AGI?人工智能的未来
...业或军事行动的任何阶段。这样的系统可能以人类大脑为模型,但并不一定必须如此,重要的是这样的系统可以被用来取代人类大脑,从组织和管理矿山或工厂到驾驶飞机、分析情报数据或规划战斗等各种任务。Mark Gubrud认为【A...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
谷歌DeepMind推Imagen2;ChatGPT Plus恢复订阅;OpenAI提出用小模型监督大模型 | 本周硅谷发生了什么?
...览本周AI领域涌现多项重要进展。Runway宣布开展通用世界模型研发,旨在通过研究通用世界模型改进其视频生成系统,使其更好地模拟现实世界的互动。谷歌Deepmind推出Imagen 2,一款高质量、逼真的人工智能图像生成器。Mistral AI...……更多
...放率田间观测数据,成功训练和验证了随机森林机器学习模型,完成历史基准(2018年)与气候变化情景下的全球高分辨率模拟,产出5弧分(约10km)网格尺度的全球农田氨排放数据集。研究表明,高效肥选用、深施等肥料管理措...……更多
筑牢湾区网络安全防线!Coremail亮相大湾区网络安全大会
...另一方面,Coremail也在积极探索AI赋能高效办公,推出AI大模型整合方案,将邮箱能力解耦调用,以邮箱桥接大模型,实现智能化和自动化。 聚焦网络安全大会:Coremail分享信创环境下邮件数据安全的探索与实践 聚焦AI+把脉邮件...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...即理解人们思维的能力,是开发具有类人社会智能的 AI 模型的重要基础。近日,来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出...……更多
...中国信通院与北京智源研究院、天津大学等联合发布了大模型评测体系3.0,暨“方升”大模型基准测试体系。据介绍,测试指标重点强化行业和场景导向的能力考查,提出了自适应动态测试方法,测试数据超过百万条,并首次推...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
Mamba 架构的大模型又一次向 Transformer 发起了挑战。Mamba 架构模型这次终于要「站」起来了?自 2023 年 12 月首次推出以来,Mamba 便成为了 Transformer 的强有力竞争对手。此后,采用 Mamba 架构的模型不断出现,比如 Mistral 发布的首...……更多
更多关于科技的资讯:
潍坊市坊子区举行食品产业链路演对接会,推动资源共享,促进“互配互采”—— 政企同心绘就食品产业“新蓝图”
鲁网3月8日讯“这场对接会真是一场及时雨!”3月7日,刚刚走出对接会会场,山东同源水业有限公司负责人徐源就感慨道。据了解
2025-03-08 16:39:00
厦门中芯云大数据研究院发布HUB AI健康助手,开启智能健康新时代
2025年2月22日,厦门中芯云大数据研究院今日宣布,其自主研发的HUBAI健康助手正式发布,推出手机版和电视版两款产品
2025-03-08 17:08:00
全国人大代表尹双凤:完善科技评价标准化机制,激发创新驱动力
本文转自:人民网-湖南频道全国人大代表尹双凤。受访单位供图人民网长沙3月8日电 (记者林洛頫)在科技创新成为全球竞争焦点的当下
2025-03-08 17:44:00
本文转自:人民日报本报记者 耿 磊 葛 燊 杨翘楚3月8日上午,十四届全国人大三次会议第二场“代表通道”在人民大会堂举行
2025-03-09 06:25:00
本文转自:人民日报本报记者  蒋雨师作为一名参与全国两会报道的摄影记者,以往我主要根据个人经验选择拍摄点位和角度,这次人工智能(AI)助手成了我的报道“搭子”
2025-03-09 06:28:00
本文转自:人民日报中兴通讯高级副总裁  苗伟代表近年来,中兴通讯在5G、云计算、大数据、人工智能等核心技术领域持续创新
2025-03-09 06:29:00
饿了么定制升级“助老e餐”服务  政企合作共建数字化未来社区
本文转自:人民日报“小饭碗”关系着老龄事业的“大民生”。对很多老人而言,解决好每天的吃饭问题,居家养老的安全感和幸福感就能大幅提升
2025-03-09 06:30:00
本文转自:人民日报马新强代表谈科技自立自强——创新是一场没有终点的长跑(现场·代表通道)本报记者 耿 磊43秒,能做什么
2025-03-09 06:32:00
时速近200公里!小米SU7 Ultra深夜狂飙严重超速 官方通报:车主已抓获
快科技3月9日消息,日前,山东潍坊公安就一起“司机驾驶小米SU7 Ultra飙车”事件发布情况通报。根据潍坊交警抖音账号公布的视频画面显示
2025-03-09 06:46:00
你会扶吗!00后小伙遇大爷摔倒毫不犹豫扶:觉得讹人的应该挺少的
3月9日消息,一位00后小伙的善举引起了网友的热议,不少人纷纷为他点赞。近日,山东潍坊00后小伙张先生偶遇大爷摔倒。当时大爷骑的三轮倒在马路边上
2025-03-09 06:46:00
专家称0补课、0月考孩子成绩都是A:国内教育应停止“掐尖”急功近利
3月9日消息,全国人大代表、重庆市九龙坡区谢家湾学校党委书记刘希娅近日公开表示,学校0补课0月考,9成孩子成绩是A。刘希娅建议革新人才培养机制
2025-03-09 06:46:00
小米终结特斯拉销量神话
外媒惊呼,特斯拉神话已经被小米终结了。在中国市场,特斯拉Model 3的销量已经被小米SU7超越。连外国网友也不由惊叹小米SU7的实力
2025-03-08 13:45:00
“实习生也月入过万”,这一行业严重缺人
作者: 张旦珺市场对寻求AI人才的渴望,到了按图索骥的程度。晚点latepost曾在报道中记录过这样一个细节:当一位投资人循着AI论文上的名字一个个去拜访时
2025-03-09 03:32:00
英特尔酷睿Ultra 9 285H性能实测:50W超越前代90W性能
年初英特尔正式发布了英特尔酷睿Ultra 200H标压处理器,该系列对应上一代酷睿Ultra 100H系列处理器,最高规格为16核CPU+8核GPU的配置
2025-03-08 22:45:00
直屏回归!小米16 Pro采用全新设计
近期,知名数码博主数码闲聊站带来了一则消息:即将在10月左右发布的迭代旗舰手机,将普遍转向直屏设计,并引入LIPO这一前沿技术
2025-03-08 23:15:00