• 我的订阅
  • 头条热搜
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
腾讯ailab发现了chatgpt的又一个短板
...性:ChatGPT是基于GPT-3开发的模型,GPT-3在涵盖各种领域的大规模数据集进行上训练,因此,在特定领域的表现,是这次研究者们的重点之一。提示词翻译为了设计触发ChatGPT机器翻译能力的提示词,腾讯AILab团队向ChatGPT提出以下pro...……更多
迎接新一轮AI狂欢,小i机器人厚积薄发|智氪
...对话式AI领域,而小i机器人便是最早将人机交互技术引入大规模商用的技术厂商之一。早在2006年,小i机器人上线第一款B端产品“上海科委海德先生”,成功摸索出一条智能客服商业化路径。因此,无论是To C还是To B的对话式AI...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
...于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。一直以来,想要完整建模在线购物相当复杂,主要痛点是:多任务性:在线购物...……更多
小i机器人成功登陆上市纳斯达克 抢跑中国版ChatGPT
...自主研发并具有自有知识产权的认知智能平台,并已实现大规模商业化变现。”做中国版ChatGPT对于ChatGPT的横空出世,不少业内分析指出,这是NLP技术的一大步,开启了通用人工智能的大门。复旦大学计算机学院教授邱锡鹏认为...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...种识别、多维度数据质量评估,由此,就获得了高质量、大规模多语言数据。与此同时,通过利用多语言MoE、参数扩展方法,从而保证主导语言(如中英)性能不下降的情况下,提升了其他语种的性能。微调阶段,基于多语言大...……更多
千行百业加速拥抱大模型(AI前沿观察)
...学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
“2024语料风云榜”发布,10家企业上榜!
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...上做出了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映射关系,从而能够实现“...……更多
首个语料库建设导则面世!近二十家企业共同发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
...大模型评估基准FullStack Bench。这是一个专注于全栈编程和多语言编程的代码评估数据集,它首次囊括了编程全栈技术中超过11类真实场景,覆盖16种编程语言,包含3374个问题。FullStack Bench的应用领域抽取自全球最大的程序员技术...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...大会(WAIC2024)上,如何有效供给高质语料数据,以支持大规模AI模型的产业应用,成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾,学界与业界正在探索可持续的解决方案,以确保AI健康发...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...、4501个三轮对话任务,全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减,表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%;在非拉丁文字语言上,所有模型的表现显著弱于...……更多
2024中国人工智能行业大模型企业竞争力100强报告发布
...、金融等特定行业,通过轻量化设计,在保持性能的同时大规模减少参数规模。如科大国创的星云大模型,通过构建大规模通用代码语料库和专用代码语料库,不仅增强了生成通用代码和形式规约的能力,而且在语言理解等方面...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与图数据挖掘领域的深度合作。...……更多
...互联网上所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称...……更多
支付宝在AI大模型时代
...国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决...……更多
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
...究,INTELLECT-1 实现了 10 倍的规模提升。这一突破证明,大规模模型训练已不再是大公司的专利,通过去中心化的、社区驱动的方式同样可以实现。他们的下一步计划是将模型进一步扩展到前沿规模,最终目标是实现开源 AGI。这...……更多
更多关于科技的资讯:
8+64G起步!iPhone SE 4来了:2025年苹果继续保留64G
快科技2月17日消息,刹那数码爆料,iPhone SE 4仍然会保留64G版本,提供64G、128GB和256G三种选择
2025-02-17 18:54:00
首搭华为乾崑智驾+鸿蒙座舱!岚图梦想家新车亮相:2月19日上市
快科技2月17日消息,岚图梦想家宸星灰车色在央视《中国经济引力场》节目中亮相,并将于2月19日正式上市。新车将首次搭载华为乾崑智驾系统和鸿蒙座舱
2025-02-17 19:24:00
雕出黑悟空雪雕师又雕了6米高哪吒:让家乡人有个打卡的地方
2月17日消息,据媒体报道,随着电影《哪吒2》的走红,黑龙江鹤岗一座6米高的雪雕哪吒引发关注。据了解,哪吒雕塑的创作者曾经雕刻过黑悟空
2025-02-17 19:24:00
美国莱斯大学终身教授钮凤林已回国:专注于地震成像技术开发与应用
快科技2月17日消息,中国科学技术大学地球和空间科学学院官网显示,原任美国莱斯大学终身教授的钮凤林已回国担任中国科学技术大学地球和空间科学学院杰出讲席教授
2025-02-17 19:24:00
全球首款DeepSeek电视!创维G7F Pro发布:接入满血R1
快科技2月17日消息,据创维官方介绍,全球首款搭载DeepSeek技术的智能电视新品G7F Pro近日已发布。该机搭载机芯8R710
2025-02-17 19:24:00
华为拿下巴西大单!覆盖100城的4G/5G基站
快科技2月17日消息,巴西移动通信网络运营商iez!宣布与华为达成合作,推进4G和5G网络建设,提升网络覆盖范围和服务质量
2025-02-17 19:24:00
快科技2月17日消息,据媒体报道,近日,在山西运城盐湖景区,上演了一场飞天火壶的震撼演出,网友形容称有“哪吒闹海”的既视感
2025-02-17 19:24:00
鸿蒙智行25年全车型规划曝光:华为这套组合拳出手 友商更难了
近日,网络曝光了一份鸿蒙智行内部25年全车型规划节奏图,在智能汽车行业全面开启“淘汰赛”新阶段的背景下,揭示了华为今年在国内汽车市场的关键战役时间表
2025-02-17 19:24:00
京东超级18狂促20点开始 先领60元补贴
京东超级 18 活动来了,18元抢千元大牌爆款!今日 0 点开启,现在前往活动会场,可领取 60 元额外补贴 + 抢 18 元超级福利
2025-02-17 19:24:00
平均每月20款游戏“杭州造” 下一个中国游戏之都来了?
最近,一个数据再次刷新人们对中国游戏业产能的认知:国家新闻出版署发布2025年1月国产网络游戏审批信息,全国共有123款游戏获批
2025-02-17 19:28:00
本文转自:人民网人民网深圳2月17日电 (王星)日前,深圳市福田区政务大模型2.0版上线,启用70名基于DeepSeek开发的“AI数智员工”
2025-02-17 19:49:00
迅雷:用户下载AI大模型 提供免费加速服务
快科技2月17日消息,为满足广大AI开发者、数据科学家及研究人员对海量数据和前沿模型的迫切需求,迅雷出手了。迅雷宣布,将针对下载AI大模型及数据集文件的迅雷用户
2025-02-17 19:54:00
妈妈回应在高速应急车道停车打孩子:他要跳车 忍不到服务区了
快科技2月17日消息,日前,一条“妈妈在高速应急车道停车 下车打孩子”的视频,引起网友关注热议。视频中,这位妈妈在路边找到了一根树枝
2025-02-17 19:54:00
蔚来第三品牌首车!萤火虫核心参数曝光:搭42度电池 续航420km
快科技2月17日消息,工信部今日发布了第十四批《减免车辆购置税的新能源汽车车型目录》。目录中,我们发现了蔚来第三品牌首车萤火虫的信息
2025-02-17 19:54:00
拖拉机加装北斗导航:实现厘米级精准定位 自动规划路径
快科技2月17日消息,中国北斗卫星导航系统官方消息称,在湖北省武汉市黄陂区六指街的港湾村,一片广袤的2万亩高标准农田正焕发着科技的魅力
2025-02-17 19:54:00