• 我的订阅
  • 头条热搜
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购物相当复杂,主要痛点是:多任务性:在线购物...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。微调阶段,基于多语言大...……更多
千行百业加速拥抱大模型(AI前沿观察)
...学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
“2024语料风云榜”发布,10家企业上榜!
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...上做出了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映射关系,从而能够实现“...……更多
首个语料库建设导则面世!近二十家企业共同发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...大会(WAIC2024)上,如何有效供给高质语料数据,以支持大规模AI模型的产业应用,成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾,学界与业界正在探索可持续的解决方案,以确保AI健康发...……更多
2024中国人工智能行业大模型企业竞争力100强报告发布
...、金融等特定行业,通过轻量化设计,在保持性能的同时大规模减少参数规模。如科大国创的星云大模型,通过构建大规模通用代码语料库和专用代码语料库,不仅增强了生成通用代码和形式规约的能力,而且在语言理解等方面...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与图数据挖掘领域的深度合作。...……更多
...互联网上所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称...……更多
支付宝在AI大模型时代
...国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决...……更多
...数据的“中央厨房”。目前,交易所正在持续推动建设更大规模的大模型训练语料库,推动非公开数据集和算力进场交易,为北京AI原生产业发展提供支撑保障。就在近期,交易所刚刚发布北京100个人工智能大模型高质量训练数...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...PT(GenerativePre-trainedTransformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑 该系列包含三款各具特色的型号:Claude3Haiku、Claude3Sonnet以……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT-4o 的表现。上述评测还显示,o1模型在MMLU Categories中的高数测试正确率高达98%,且在ML Bench...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行(通常是让模仿互联网上的内容),目标是通过在较大的任务上训练模型,使得模型学习到通用的特征。而后训练指的是专注针对特定行为优化模型...……更多
更多关于科技的资讯:
荣耀平板v9正式开售:搭载联发科8350处理器
12月16日晚,荣耀正式发布荣耀平板V9。12月24日,CNMO注意到,据荣耀官方消息,荣耀平板V9正式开售时间为今日早上10点08分
2024-12-25 16:43:00
“树人托管惊爆招商新政策,千万别错过这波机遇!“
在当前经济波动和服务业不断深入发展的大背景下,家庭服务业的细分行业——中小学生校外托管行业也面临前所未有的发展机遇,受到广泛的关注
2024-12-25 16:45:00
通讯员 李国秀 王俊菲走进山东厚丰汽车散热器有限公司的研发基地,精密的仪器彰显着高端的科技,其中整车环境模拟实验室可以将环境温度保持在-40℃—60℃的范围内进行试验
2024-12-25 16:54:00
小米官宣:与蔚来、小鹏、理想合作
12月25日,小米汽车通过官方微博宣布,正式与蔚来汽车、小鹏汽车、理想汽车展开充电补能网络合作。此次合作旨在为用户提供更高效便捷的充电服务
2024-12-25 16:55:00
拼多多代运营领域靠谱的代运营团队,电商代运营公司十大排名
在拼多多这个竞争超级激烈的电商平台里混,商家们的日子可不容易。流量就那么多,大家都在抢,想多卖点货、多赚点钱,简直难如登天
2024-12-25 17:10:00
2024“星鲨杯”全球虚拟现实内容大赛颁奖典礼暨《虚拟/增强现实内容制作流程规范》国家标准系列宣贯活动在京举行
中国消费者报北京讯(记者董芳忠)由虚拟现实内容制作中心、星鲨科技集团有限公司主办,青岛星鲨虚拟现实技术研究院协办的2024“星鲨杯”全球虚拟现实内容大赛颁奖典礼于近日在北京举行
2024-12-25 17:46:00
发展新质生产力看山西国企:山西省首个数字孪生隧道全息感知平台正式上线
近日,山西交控交科集团智研院公司研发的山西省首个数字孪生隧道全息感知平台正式上线,并在大南山隧道管理站正式投入使用。此平台是基于数字时空底座能力
2024-12-25 17:47:00
让顺风车用户再次同行更便捷 嘀嗒出行上线顺风车“再次同行邀请”功能
顺风出行,如何更方便地与同行过的同路人再次同行呢?近日,嘀嗒出行推出全新的再次“同行邀请“功能,让曾同行过的车主乘客,下次同行更方便
2024-12-25 17:48:00
嘉桦白桦树汁品牌践行人与自然和谐共生
12月18日,第七届界面财经年会在上海举行,嘉桦白桦树汁品牌凭借其卓越的创新能力和可持续发展实践,荣膺年度臻善企业奖,彰显了品牌在行业内的领先地位与社会责任感
2024-12-25 17:49:00
临沂:企业开足马力赶订单 奋力冲刺“全年红”
冲刺四季度,打好收官战。连日来,临沂市各企业纷纷按下生产“快进键”,开足马力赶订单,奋力夺取“全年红”。
2024-12-25 17:49:00
“潮好玩冰雪季”圆满收官,耕升带你回顾趣味瞬间!
“潮好玩冰雪季”已于2024年12月22日在吉林圆满收官!为了让众多游戏迷和科技爱好者积极参与到这次盛大的活动中,耕升上演一场科技与冰雪的激情碰撞
2024-12-25 17:58:00
中新经纬12月25日电 据工信部官网25日消息,近日,工业和信息化部、国务院国有资产监督管理委员会及中华全国工商业联合会联合印发《制造业企业数字化转型实施指南》(以下简称“《指南》”)
2024-12-25 17:58:00
华商网获评2024年搜狐网年度合作伙伴
2024年,媒体机构创作者们依旧积极活跃在搜狐平台上,持续追踪热点新闻、深度剖析社会现象。以其独特的视角和力量,跨越时空界限
2024-12-25 18:08:00
未来已来,华科尔推出量产级车载无人机WK-AC20MINI
在汽车上配备无人机,一直是汽车行业的宏大梦想之一。如今,梦想照进现实,作为全球主流的无人机制造商,华科尔推出全新的微型车载无人机场WK-AC20MINI
2024-12-25 18:26:00
京东客服再加薪!月固定工资大幅提升,全员平均涨薪2个月
12月25日,京东集团宣布,再次升级客服人员薪酬福利。超2万名京东客服月固定工资将大幅提升,提高收入的保障性和稳定性,实现全员平均涨薪2个月
2024-12-25 18:28:00