• 我的订阅
  • 头条热搜
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
千行百业加速拥抱大模型(AI前沿观察)
...学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
“2024语料风云榜”发布,10家企业上榜!
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映射关系,从而能够实现“...……更多
首个语料库建设导则面世!近二十家企业共同发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...大会(WAIC2024)上,如何有效供给高质语料数据,以支持大规模AI模型的产业应用,成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾,学界与业界正在探索可持续的解决方案,以确保AI健康发...……更多
2024中国人工智能行业大模型企业竞争力100强报告发布
...、金融等特定行业,通过轻量化设计,在保持性能的同时大规模减少参数规模。如科大国创的星云大模型,通过构建大规模通用代码语料库和专用代码语料库,不仅增强了生成通用代码和形式规约的能力,而且在语言理解等方面...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
...互联网上所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称...……更多
支付宝在AI大模型时代
...国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决...……更多
...数据的“中央厨房”。目前,交易所正在持续推动建设更大规模的大模型训练语料库,推动非公开数据集和算力进场交易,为北京AI原生产业发展提供支撑保障。就在近期,交易所刚刚发布北京100个人工智能大模型高质量训练数...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT-4o 的表现。上述评测还显示,o1模型在MMLU Categories中的高数测试正确率高达98%,且在ML Bench...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...PT(GenerativePre-trainedTransformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑 该系列包含三款各具特色的型号:Claude3Haiku、Claude3Sonnet以……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行(通常是让模仿互联网上的内容),目标是通过在较大的任务上训练模型,使得模型学习到通用的特征。而后训练指的是专注针对特定行为优化模型...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...生和博士后。将 PaperQA2 应用于矛盾检测任务让我们能够大规模识别生物学论文中的矛盾。例如,ZNF804A rs1344706 等位基因对精神分裂症患者的大脑结构有积极影响的说法与后来发表的研究相矛盾,该研究发现 rs1344706 对大脑皮质厚...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...均长度:语言多样性当今大量的商业化应用场景涉及处理多语言文档。Mistral Large 2 在大量多语言数据上进行了训练,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到,基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而,由于计算和内存成本随着序列长度的增加而增加,注意力机...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...文本模型开始,首先,添加图像适应器和编码器,然后在大规模有噪声的成对 (图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)集护眼、通透、高刷新率于一体的天马 “天工屏”;“全球最窄四等边设计”的手机屏幕……今年以来
2025-10-10 08:28:00
2025河北国际工业设计周活动观察:全球智慧赋能未来智造
全球智慧赋能未来智造——2025河北国际工业设计周活动观察9月20日,2025河北国际工业设计周主会场活动在雄安新区举行
2025-10-10 08:40:00
工信部日前公布首批制造业数字化转型促进中心建设主体名单,太原福莱瑞达物流设备科技有限公司入选。制造业数字化转型促进中心是国家落实产业数字化战略的核心公共服务载体
2025-10-10 08:42:00
10月9日,从太原第二热电厂获悉,为全力保障太原市冬季供热安全稳定,持续提升供热服务质效,太原二热秉持“早谋划、早部署
2025-10-10 08:43:00
齐鲁晚报·齐鲁壹点客户端 李孟霏在刚刚过去的国庆中秋“双节”,山东移动威海乳山分公司移动社区营销团队实现品牌口碑与业务发展的双赢
2025-10-10 11:07:00
优优绿能(301590)成立于2015年,是国内直流充电桩模块领军企业之一,2024年在国内充电模块市占率达16%,位居行业第二
2025-10-10 23:06:00
恒润达生信披“迷雾”:“消失”的研发总监与首席科学家?
除研发核心人员离职或在外创办同行业企业外,上海恒润达生生物科技股份有限公司(下称“恒润达生”)招股书对研发团队人员信披的真实性
2025-10-10 23:06:00
互联网贷款普及后,不少初次接触的用户常因平台选择难、流程不熟悉犯愁。其实只要按步骤操作执行,安全又高效,下面由榕易有钱为大家梳理了几项关键步骤
2025-10-10 11:34:00
从志愿翻译到时装新星 河南姑娘在非洲书写青春与梦想
大河网讯 非洲大陆,机遇与挑战并存。越来越多的中国人选择在这里扎根创业,为当地发展注入新活力。毕业于河南工业大学的何方方便是其中之一
2025-10-10 12:11:00
姜杰秀:心中有梦,创业有方,用执着与努力让喜龙果出海
鲁网10月10日讯“我父亲就是做农副产品加工的,从小受父亲的熏陶,我对农副产品加工就有别样的情愫。于是,我就在农副产品加工上有了梦想
2025-10-10 13:56:00
中新经纬10月10日电 “市说新语”微信号10日消息,近日,国家市场监管总局(国家标准委)批准发布一批重要国家标准,涉及助老扶幼
2025-10-10 14:06:00
解锁工业自动化密码,威图与易盼2025IAS硬核破圈瞬间
"新质驱动、高端引领、数智赋能" ,2025中国国际工业博览会聚焦新工业新经济,旨在拉开加快构建一流产业生态,开启智能制造新时代的帷幕
2025-10-10 14:59:00
圆满收官 | 威图RiLineX全新一代配电平台正式发布
制造业行业数字化与智能化水平要求日益提升,这意味着制造业将面临集人力、技术、时间和成本全面优化的巨大挑战。配电系统作为工业场景下能源传输的载体
2025-10-10 14:59:00
河北日报讯(许君强、李晴宇)9月24日,2025河北国际工业设计周辛集分会场活动在辛集市工业设计创新中心启动。此次分会场以“跨界融合·创新设计”为主题
2025-10-10 15:23:00
中新经纬10月10日电 题:这届年轻人,为什么抢着把“国宝”贴冰箱上作者 周慎 中国科大先研院人工智能文旅融合研究院执行院长十一黄金周刚过
2025-10-10 15:45:00