• 我的订阅
  • 头条热搜
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
... 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理,Meta 将 16 位 (BF16) 量化为 8 位 (FP8),从而降低了计算要求,并使模型能够在单个服务器节点上运行。 4、在 15.6T token(3.8x10²⁵ FLOPs)上预训练 405B 是一……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
...室已初步建成600TF算力的智算平台和面向多领域多用途的大规模藏语数据资源库。青海师范大学省部共建藏语智能信息处理及应用国家重点实验室2021年2月经中国科技部批准建设,是中国唯一的藏语信息处理领域国家重点实验室...……更多
千行百业加速拥抱大模型(AI前沿观察)
...学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...论文地址:https://arxiv.org/abs/2407.10817模型本身在经历多轮大规模指令任务调整后,可以遵循一套新的指令,使它们适合用作模型输出的自动评估器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断...……更多
“2024语料风云榜”发布,10家企业上榜!
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映射关系,从而能够实现“...……更多
首个语料库建设导则面世!近二十家企业共同发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...-上海频道人民网上海7月6日电 (记者唐小丽)高质量、大规模、安全可信的语料数据资源是AI时代的重要基石。7月6日上午,2024世界人工智能大会语料主题论坛在上海世博中心举办。本次论坛以“语料筑基,智生时代”为主题,...……更多
AI数据之战:大模型的“燃料”还能烧多久?
...大会(WAIC2024)上,如何有效供给高质语料数据,以支持大规模AI模型的产业应用,成为业界内外专家热烈讨论的核心议题之一。面对数据稀缺与模型旺盛需求之间的矛盾,学界与业界正在探索可持续的解决方案,以确保AI健康发...……更多
2024中国人工智能行业大模型企业竞争力100强报告发布
...、金融等特定行业,通过轻量化设计,在保持性能的同时大规模减少参数规模。如科大国创的星云大模型,通过构建大规模通用代码语料库和专用代码语料库,不仅增强了生成通用代码和形式规约的能力,而且在语言理解等方面...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的评估中,对比当前最优的开源模型,Qwen2-72B 在包括自然语言理解...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,赋予了语言模型强大的多模态处理和推理能力,能让模型更好地理解和建模复...……更多
...互联网上所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称...……更多
支付宝在AI大模型时代
...国科技巨头不断取得突破性进展。不过,AI技术能力和AI大规模落地应用的可行性是两回事。两者之间,隔着成本可控、可持续性等必须解决的难题。在AI规模化落地应用的可行性上,中国互联网公司正在积极探索和验证各种解决...……更多
...数据的“中央厨房”。目前,交易所正在持续推动建设更大规模的大模型训练语料库,推动非公开数据集和算力进场交易,为北京AI原生产业发展提供支撑保障。就在近期,交易所刚刚发布北京100个人工智能大模型高质量训练数...……更多
GPT-4最强对手出现!Claude-3 AI模型发布
...PT(GenerativePre-trainedTransformer)技术的大型语言模型,通过在大规模文本数据上的预训练,学会了自然语言理解和生成的能力。亚马逊于今日宣布使用Claude3来优化其商业逻辑 该系列包含三款各具特色的型号:Claude3Haiku、Claude3Sonnet以……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...分,成为首个能与人类专家展开竞争的AI模型。在 MMLU(大规模多任务语言理解)测试中,在总计57个子类别中,o1在54个类别上都超越了GPT-4o 的表现。上述评测还显示,o1模型在MMLU Categories中的高数测试正确率高达98%,且在ML Bench...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...通常会提到“预训练”、“后训练”等术语。预训练常在大规模的数据集上进行(通常是让模仿互联网上的内容),目标是通过在较大的任务上训练模型,使得模型学习到通用的特征。而后训练指的是专注针对特定行为优化模型...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...均长度:语言多样性当今大量的商业化应用场景涉及处理多语言文档。Mistral Large 2 在大量多语言数据上进行了训练,特别是在英语、法语、德语、西班牙语、意大利语、葡萄牙语、荷兰语、俄语、中文、日语、韩语、阿拉伯语...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...生和博士后。将 PaperQA2 应用于矛盾检测任务让我们能够大规模识别生物学论文中的矛盾。例如,ZNF804A rs1344706 等位基因对精神分裂症患者的大脑结构有积极影响的说法与后来发表的研究相矛盾,该研究发现 rs1344706 对大脑皮质厚...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...文本模型开始,首先,添加图像适应器和编码器,然后在大规模有噪声的成对 (图像,文本) 数据上进行预训练。接下来,在中等规模的高质量域内和经过知识增强的 (图像,文本) 对数据上进行训练。在后训练阶段,再使用与文...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会:MEET大会是由量子位...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...,先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法。这些算法模型均在大数据支持下拥有较大规模模型参数,具备较强的通用能力,可完成多场景任务,显著降低学习成本...……更多
更多关于科技的资讯:
齐鲁晚报·齐鲁壹点 李可 通讯员 殷海奎郓城农商银行为持续加大金融业务宣传力度,有效推进首季度相关工作,该行积极践行多元策略
2025-01-26 19:53:00
“保险维权专家”“代理退保法务”背后可能是“代理退保”
近年来,“代理退保”黑中介的活动猖獗,严重扰乱金融保险市场的正常运行秩序。非法中介打着“为消费者退保维权”的旗号,博取消费者的信任
2025-01-26 20:24:00
【多彩新论】文化旅游乘“数”翱翔
文化旅游遇到数字技术,会摩擦出怎样的“火花”?借助VR、AR技术,三星堆的青铜面具能“开口诉说”古蜀故事,故宫的红墙黄瓦在虚拟场景里重现昔日繁华
2025-01-26 20:34:00
北大科学家固态电池新突破:分钟级快充、循环寿命25000次
快科技1月26日消息,被认为是动力电池最终解决方案的固态电池有了新进展,近期,我国科学家在该方面取得了新的突破。北京大学的庞全全团队开发了一种新型电解质材料
2025-01-26 20:36:00
科技赋能!壹点3D超写实数字人\
齐鲁晚报·齐鲁壹点 陈朕 赵长春 张雅楠在辞旧迎新的美好时刻,备受瞩目的2025端上春晚于1月26日盛大播出。作为一年一度的文化重头戏
2025-01-26 20:58:00
新春走基层|”以旧换新“过大年
本文转自:人民网-江苏频道江楠傅军委为客户安装新空调。人民网 江楠摄“客户昨天下单,旧机已拆,抓紧安排新机装配。” 1月23日上午
2025-01-26 21:34:00
第三次这么干!雪佛兰海外推出新车型:宝骏悦也Plus换了标
快科技1月26日消息,宝骏的车换上雪佛兰的标出口的第三世界市场,并不是件稀奇的事,而且这种情况已经第三次发生了。近日,GM Authority披露了雪佛兰将在海外市场推出的全新车型“Spark”的实车图
2025-01-26 22:06:00
蔚来法务部:近期出现系列有组织大规模恶意攻击、已起诉
快科技1月26日消息,今晚,蔚来法务部发布“关于打击黑公关和网络水军的声明”,提到近期网上再次出现一系列针对蔚来公司及旗下蔚来和乐道品牌的有组织大规模恶意攻击
2025-01-26 22:36:00
宝马高管:不会配备更大更多车载屏幕、并不实用
快科技1月26日消息,近日,宝马首席开发官Frank Webber在接受采访时发表了对车载屏幕的看法。其认为宝马iDrive X的屏幕已经足够大
2025-01-26 22:36:00
最高补贴500元!手机“国补”落地滨州,引发消费热潮
齐鲁晚报·齐鲁壹点 赵旭 高艳蕊1月24日,正值岁末年初的交接之时,滨州市商务局携手四家相关部门共同揭晓了《滨州市手机
2025-01-26 20:59:00
国补上线!中国电信山东公司多重补贴来袭
近日,随着商务部等五部门联合印发的《手机、平板、智能手表(手环)购新补贴实施方案》正式落地,1月21日山东省商务厅等5部门印发了《山东省手机
2025-01-26 22:18:00
齐鲁晚报·齐鲁壹点 闫丽君 邵舒琨1月26日,烟台市人民政府新闻办公室召开“一路山海·烟台购 2025烟台市惠民消费券”活动新闻发布会
2025-01-26 17:02:00
男子眼球内捉出4条蠕动线虫:左眼曾飞进去过一只苍蝇
1月26日消息,据媒体报道,浙江的杨先生到医院就诊,他感觉左眼里有虫子在钻。医生翻开病人上睑发现数条正在蠕动的白色寄生虫
2025-01-26 17:05:00
精心部署确保网络畅通,东营联通助力春晚圆满举行
近日,随着欢声笑语的弥漫,垦利区春节联欢晚会如期拉开帷幕。在这场文化盛宴的背后,东营联通垦利区分公司提前筹划、精心保障
2025-01-26 17:11:00