• 我的订阅
  • 头条热搜
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。微调阶段,基于多语言大...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购物相当复杂,主要痛点是:多任务性:在线购物...……更多
最新美国国家人工智能科学院院士介绍
...来自牛津大学,专注于机器学习和数据挖掘,尤其在处理大规模数据集方面取得了显著成果。 SophiaWang,来自哈佛大学,致力于自然语言处理与机器翻译的研究,提高了多语言之间的转换准确率。EthanLee,来自加州大学圣地亚哥...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...以下一个token预测为例,说明了这种弱激励结构如何通过大规模多任务学习,鼓励模型学习解决数万亿个任务的通用技能,而不是单独解决每个任务。他观察到:如果尝试以尽可能少的努力解决数十个任务,那么单独模式识别每...……更多
讯飞听见,中关村论坛年会的“五届元老”非它莫属
...论坛、第45届IAA世界广告大会、2023金融街论坛年会、日本大规模人工智能科技公司展会“AI EXPO TOKYO”、2023世界制造业大会、第31届世界大学生运动会、世界人工智能大会、2023全球人工智能技术大会、澳门BEYOND国际创新博览会等...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...mer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比,大语言模型的构建过程涉及到更为复...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...文本模型开始,首先,添加图像适应器和编码器,然后在大规模有噪声的成对 (图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...预训练的Llama 3.1文本模型添加图像适配器和编码器,并在大规模噪声图像-文本对数据上进行预训练。然后,在中等规模的高质量领域内和知识增强的图像-文本对数据上,再次进行训练。 接着,在后训练阶段采用与文本模型类...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...然在理论和实验室环境中展现了巨大的潜力,但将其推向大规模商用并非易事。一个显著的挑战就是其高昂的计算和处理成本。Token的处理,涉及海量的数据分割、编码、解码以及跨模态的信息融合。这些操作需要强大的计算能...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...专注于 LLM Alignment。3. 黄灿:厦门大学数学系副教授随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种...……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
...企业客户开放。据介绍,“双子座”Ultra版本是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。“大规模多任务语言理解”结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试人工智能掌握知识...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
共赢生成式AI时代
...模型获得更准确的回答。最后一种是微调(FineTuning),指在大规模预训练的基础上,使用与目标任务相关的数据进行进一步训练。通过微调,企业可以把通用模型与部分业务数据相结合,让大语言模型快速获得对业务的理解。微调的门...……更多
影视译制:不仅是语言翻译,更是文化诠释
...足受众的消费需求,为填补电视台播出的时间空缺,中国大规模引进影视作品,影视译制迎来发展黄金期。《血疑》引发全民追看,主演登上《大众电影》的杂志封面。《追捕》在中国观影人次数以亿计,有观众在电影院看了几...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调...……更多
...公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语...……更多
终于来了!OpenAI开放GPT-4o高级语音,还用中文说「对不起」
...了上新高级语音模式,近日,OpenAI 还发布了一个多语言大规模多任务语言理解 (Multilingual Massive Multitask Language Understanding,MMMLU)数据集,测试集提供了 14 种语言,包括阿拉伯语,德语,西班牙语等,涵盖 57 个不同类别的……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...本科毕业生赵晨阳,卡内基梅隆大学硕士生贾雪莹。虽然大规模语言模型(LLM)在许多自然语言处理任务中表现优异,但在具体任务中的效果却不尽如人意。为了提升模型在特定自然语言任务上的表现,现有的方法主要依赖于高...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...PT(GenerativePre-trainedTransformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑 该系列包含三款各具特色的型号:Claude3Haiku、Claude3Sonnet以……更多
浪潮AI 人工智能“小源” 破“杀猪盘”诈骗套路
日前,由浪潮AI研究院研发的大规模中文语言模型“源1.0”在某次反诈行动中发挥出了出色的实效。期间,在“源1.0”的基础上,开发者开发了一个能够无障碍进行微信聊天的人工智能“小源”,并在与骗子的真实对话场景中进...……更多
AI,未来也许只是一种办公软件
...统和应用增强人类工作的关键机理在于其通过深度学习和大规模训练,具备了处理复杂数据、理解自然语言和模拟人类思维过程的能力,可以在没有人类干预的情况下自动化执行任务。倚仗庞大的数据集和算力资源,LLMs能够提...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
更多关于科技的资讯:
阿里1688宣布已接入DeepSeek:所有面向商家的AI全部免费
快科技2月10日消息,今天,阿里巴巴旗下1688在京启动了招商活动,并宣布所有面向商家的AI产品全部免费。比如新推出免费的AI数字员工
2025-02-10 18:17:00
中国消费者报北京讯(记者杜科)2月8日,希沃学习机全系产品接入DeepSeek大模型。目前,希沃学习机W系列、T系列、V系列等产品均能够使用包括DeepSeek在内的多种大模型能力
2025-02-10 18:33:00
曝哪吒2被越南人盗摄翻译上传外网 出品方:会努力处理
快科技2月10日消息,国产动画电影《哪吒之魔童闹海》正在热映中,截至目前累计票房已超83亿人民币,中国影史第一,放到世界范围内
2025-02-10 18:47:00
二手矿卡摇身一变成新卡!揭秘商家的那些无良操作
显卡价格居高不下,让不少游戏玩家犯了难,开始寻求性价比更高的显卡,也给了矿卡可乘之机。许多萌新玩家在不知情的情况下,成为了矿卡的“接盘侠”
2025-02-10 18:47:00
十三连冠!格力中央空调市场占有率稳居第一
快科技2月10日消息,2024年,格力中央空调实现了自2012年以来连续13年市场占有率第一的佳绩,成市场份额唯一突破15%品牌
2025-02-10 18:47:00
机械革命极光X游戏本发布:新一代铝合金机身 首发6599元
快科技2月10日消息,极光X新款游戏本现在发布上架,酷睿i7-13700HX、RTX 4060显卡,首发6599元。极光X游戏本采用了新一代高等级模具
2025-02-10 18:47:00
技嘉RTX 5080超级雕显卡评测:外挂风扇强化散热 四风扇烤机仅60度
一、前言:一看就很超级的技嘉RTX 5080超级雕来了NVIDIA推出的RTX 50系显卡,把AI图形技术带到全新的高度
2025-02-10 18:47:00
努比亚/红魔将接入DeepSeek R1:6710亿参数满血嵌入系统
快科技2月10日消息,今日,努比亚和红魔游戏手机官方都宣布,旗下手机将接入DeepSeek R1。中兴通讯终端事业部总裁
2025-02-10 18:47:00
16GB梦碎!RTX 5060显存抠唆还是8GB
快科技2月10日消息,最近网上有曝料公布了号称是索泰RTX 5060 Ti、RTX 5060的包装盒设计,赫然可以看到显存容量都是16GB
2025-02-10 18:47:00
Arm CEO评价DeepSeek:确实令人意外 但最终可能会被关闭
快科技2月10日消息,据媒体报道,Arm CEO Rene Haas在接受采访时表示,DeepSeek的出现确实令人意外
2025-02-10 18:47:00
雷军宣布元宵节在小米食堂直播:带大家云体验小米员工餐
快科技2月10日消息,雷军今天宣布,将在本周三晚上7点做一场元宵节直播,和大家一起共度元宵佳节。他还透露,这次将在小米食堂边吃边聊
2025-02-10 18:47:00
最新!DeepSeek获顶级域名认可
2月10日,记者注意到,现在在浏览器输入ai.com,可以直接定向至DeepSeek官网。图源:“长安街知事”微信公众号根据域名信息服务平台的公开数据
2025-02-10 18:49:00
《碟中谍8:最终清算》超级碗预告片发布:阿汤哥血肉之躯大战AI智体
快科技2月10日消息,今日,《碟中谍》系列新作《碟中谍8:最终清算》发布超级碗版预告,该片将于5月23日北美上映。影片由克里斯托夫·迈考利执导
2025-02-10 19:17:00
苹果独立AR眼镜计划不变!只是需要更长时间
快科技2月10日消息,前不久报道称,苹果取消了打造由Mac驱动的AR眼镜计划,这让外界猜测苹果的AR眼镜开发是否会像苹果汽车一样胎死腹中
2025-02-10 19:17:00
理想高管:今年肯定会发布纯电SUV
快科技2月10日消息,理想汽车整车电动产品负责人唐伯伯(唐华寅)在微博确认,理想汽车计划在今年推出纯电SUV车型。目前
2025-02-10 19:17:00