• 我的订阅
  • 头条热搜
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...标贝科技致力于为大语言模型提供终身学习语料ChatGPT的大规模语言模型浪潮兴起伊始,对数据也提出了全新的要求。如何为大语言模型提供的、多样化高质量语料,成为行业面临的共同挑战。作为行业的AI数据解决方案提供商,...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
腾讯ailab发现了chatgpt的又一个短板
...性:ChatGPT是基于GPT-3开发的模型,GPT-3在涵盖各种领域的大规模数据集进行上训练,因此,在特定领域的表现,是这次研究者们的重点之一。提示词翻译为了设计触发ChatGPT机器翻译能力的提示词,腾讯AILab团队向ChatGPT提出以下pro...……更多
迎接新一轮AI狂欢,小i机器人厚积薄发|智氪
...对话式AI领域,而小i机器人便是最早将人机交互技术引入大规模商用的技术厂商之一。早在2006年,小i机器人上线第一款B端产品“上海科委海德先生”,成功摸索出一条智能客服商业化路径。因此,无论是To C还是To B的对话式AI...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购物相当复杂,主要痛点是:多任务性:在线购物...……更多
小i机器人成功登陆上市纳斯达克 抢跑中国版ChatGPT
...自主研发并具有自有知识产权的认知智能平台,并已实现大规模商业化变现。”做中国版ChatGPT对于ChatGPT的横空出世,不少业内分析指出,这是NLP技术的一大步,开启了通用人工智能的大门。复旦大学计算机学院教授邱锡鹏认为...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。微调阶段,基于多语言大...……更多
千行百业加速拥抱大模型(AI前沿观察)
...学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
“2024语料风云榜”发布,10家企业上榜!
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...上做出了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映射关系,从而能够实现“...……更多
首个语料库建设导则面世!近二十家企业共同发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...大会(WAIC2024)上,如何有效供给高质语料数据,以支持大规模AI模型的产业应用,成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾,学界与业界正在探索可持续的解决方案,以确保AI健康发...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于...……更多
2024中国人工智能行业大模型企业竞争力100强报告发布
...、金融等特定行业,通过轻量化设计,在保持性能的同时大规模减少参数规模。如科大国创的星云大模型,通过构建大规模通用代码语料库和专用代码语料库,不仅增强了生成通用代码和形式规约的能力,而且在语言理解等方面...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与图数据挖掘领域的深度合作。...……更多
...互联网上所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称...……更多
支付宝在AI大模型时代
...国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决...……更多
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
...究,INTELLECT-1 实现了 10 倍的规模提升。这一突破证明,大规模模型训练已不再是大公司的专利,通过去中心化的、社区驱动的方式同样可以实现。他们的下一步计划是将模型进一步扩展到前沿规模,最终目标是实现开源 AGI。这...……更多
更多关于科技的资讯:
小米计划2025年发布新款oled屏幕平板
近日,有消息人士透露,小米计划在2025年发布新款的OLED屏幕平板,同时小米品牌的OLED笔记本电脑也在调研当中。小米笔记本电脑10月29日
2024-12-04 14:31:00
“就像中国已经成为制造太阳能电池板、电池和电动汽车的领先者一样,我们认为中国也有机会成为绿色船用燃料的领先者。”马士基集团北亚区首席代表彦辞日前接受人民日报海外网专访时表示
2024-12-04 14:31:00
iqooz9x性价比到底有多高?
如今的智能手机市场就像是一场激烈的武侠大会,各路英雄争奇斗艳。而iQOOZ9x,凭借在安兔兔千元机性价比排行榜上拔得头筹
2024-12-04 14:33:00
一加ace3pro,拍照、续航两不误
以前OPPO可是被称为“高价低配”、“智商鉴定机”的代名词,再加上其受厂妹们的青睐,简直成了乡镇KTV外景的标准配备。不过呢
2024-12-04 14:35:00
12月7日开战!京东2024年双12大促来了:跨店满300减40元
快科技12月4日消息,双12年终大促即将打响,根据京东公布的12.12活动规则,京东双12活动整体分为预热期、正式期两个阶段
2024-12-04 14:38:00
TikTok年度数据分析:短视频巨头的用户行为和市场趋势
TikTok这个迅速崛起的短视频平台,随着其用户基础的不断增长,不仅改变了媒体消费的习惯,也为品牌营销提供了新的机遇。本文将通过年度数据分析
2024-12-04 14:40:00
2024年12月10-11日,由中共重庆市委金融委员会办公室指导,清科创业(1945.HK)、投资界、重庆渝富控股集团有限公司联合主办的第二十四届中国股权投资年度大会将于重庆举办
2024-12-04 14:56:00
赋能新质生产力,稳中求进创新机——2024东方财富私募风云际会论坛盛大召开
“赋能新质生产力,稳中求进创新机”,12月1日,2024东方财富私募风云际会论坛在湖南长沙盛大举行,业内精英共商资本市场创新机遇
2024-12-04 14:56:00
本文转自:人民网焦磊人民网北京12月4日电 (焦磊)进入数字经济时代,云计算、人工智能、大数据、物联网等数字技术加速各行业变革浪潮
2024-12-04 14:56:00
全球唯一24K黄金版特斯拉Cybertruck发起慈善拍卖:起拍价超62万元
快科技12月4日消息,近日,一辆2024款特斯拉Cybertruck Foundation版本因其车身镀有24K纯金而备受瞩目
2024-12-04 15:08:00
鸿蒙AI强得飞起!华为Mate 70 Pro+系统级智能排名第一
快科技12月4日消息,华为终端官微发布消息,2024中国电信终端洞察报告新鲜出炉,在AI手机智能度评测中,华为Mate70 Pro+的系统级智能度等四项智能度排名第一
2024-12-04 15:08:00
被字节索赔800万的实习生:拿下NeurIPS 2024最佳论文!
快科技12月4日消息,据媒体报道,因恶意攻击字节训练集群,而被起诉赔偿侵权损失800万元及合理支出2万元,并公开赔礼道歉的实习生田某某
2024-12-04 15:08:00
贾跃亭挖来前奇瑞汽车工程研究院院长:负责FX 6车系
快科技12月4日消息,法拉第未来(FF)汽车宣布,中国汽车行业领袖、车辆开发和安全技术专家顾镭博士将出任FX全球EV研发研究院院长及FX 6车系负责人(VLE)
2024-12-04 15:08:00
排名第一!华为Mate 70 Pro+获中国电信大众直连卫星手机五星评价
快科技12月4日消息,今日,“华为终端”宣布,2024中国电信终端洞察报告新鲜出炉,华为Mate 70Pro+和华为Mate X6在大众智能直连卫星手机总体评价中分别获直板屏/折叠屏综合评价五星
2024-12-04 15:08:00
赋能高质量发展,江苏移动竞逐大模型赛道
本文转自:人民网-江苏频道江楠中国移动智算中心(南京)。江苏移动供图通过心理大模型,可以了解青少年的心理状况;结合AI算法
2024-12-04 15:13:00