• 我的订阅
  • 头条热搜
...公司等近日宣布,利用超级计算机“富岳”,他们开发的大规模语言模型“Fugaku-LLM”正式发布。“Fugaku-LLM”是首个完全由日本国产技术构建的AI语言模型,其在处理日语及相关文化内容上表现卓越。模型特别擅长基于日语敬语...……更多
openai发布多语言大规模多任务语言理解
...23日)发布博文,报道称OpenAI在HuggingFace上发布了多语言大规模多任务语言理解(MMMLU)数据集。背景随着语言模型日益强大,评估其在不同语言、认知和文化背景下的能力已成为当务之急。OpenAI决定推出MMMLU数据集,通过提供强...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
... MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料(MMedC)构建在构建数据集方面,研究团队收集了一份多语言医疗语料库,命名为 MMedC。该数据集包含 255 亿 tokens,其内容来自于四个来源:1. 通过启发...……更多
...过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在考虑采用分级方法来监管生成式人工智能(AI)模型。一项提案称,欧盟将...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...mer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模型相比,大语言模型的构建过程涉及到更为复...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统...……更多
...工智能大模型,标志着国内大模型从小范围内测开始走向大规模应用。大模型将如何为个人和产业赋能?这轮开放服务将为行业竞争带来什么影响?国内大模型未来的发展趋势又将如何?人工智能大模型竞争进入新阶段9月初,...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...了解决这一问题,研究团队提出了Medical-CXR-VQA,这是一个大规模的X光胸片问答数据库,覆盖了更广泛的问题类型,包括异常、存在、位置等七种问题类型,为构建更准确的医学VQA模型提供了基础。多模态大语言模型 (Multimodal Larg...……更多
...、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...专注于 LLM Alignment。3. 黄灿:厦门大学数学系副教授随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种...……更多
...企业客户开放。据介绍,“双子座”Ultra版本是首个在“大规模多任务语言理解”(MMLU)领域超越人类专家的模型。“大规模多任务语言理解”结合了数学、物理、历史、法律、医学和伦理学等57个学科来测试人工智能掌握知识...……更多
新研究:日本人祖先或有“3方起源”
来源:看看新闻Knews日本研究团队日前通过大规模分析日本人全基因组测序数据,为日本人祖先有三支的“三方起源模型”提供了证据,而不是迄今被广泛接受的“二元结构模型”。日本理化学研究所日前发布新闻公报说,研究...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...,先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法。这些算法模型均在大数据支持下拥有较大规模模型参数,具备较强的通用能力,可完成多场景任务,显著降低学习成本...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...计算机视觉、音频处理以及估计和预测等任务。首个通用大规模Mamba模型上面提到,基于注意力机制的Transformer是当今所有最强大语言模型中占主导地位的架构。然而,由于计算和内存成本随着序列长度的增加而增加,注意力机...……更多
AI视野:Gen-2支持生成4K高清视频;Midjourney推出Style Tuner工具;
...语言模型日本电报电话公司(NTT)宣布将在明年3月推出大规模语言模型(LLM),为生成式日语学习人工智能提供支持,以降低学习成本和与美国信息技术巨头竞争。Phind:一款号称代码能力超越GPT-4的模型Phind是一个声称代码能力超...……更多
最新美国国家人工智能科学院院士介绍
...来自牛津大学,专注于机器学习和数据挖掘,尤其在处理大规模数据集方面取得了显著成果。 SophiaWang,来自哈佛大学,致力于自然语言处理与机器翻译的研究,提高了多语言之间的转换准确率。EthanLee,来自加州大学圣地亚哥...……更多
大语言模型、量子计算、再生稻等入选2023年度十大科技名词
...能。生成式人工智能是利用复杂的算法、模型和规则,从大规模数据集中学习,以创造新的原创内容的人工智能技术。2022年末,OpenAI推出的ChatGPT标志着这一技术在文本生成领域取得显著进展,2023年被称为生成式人工智能的突破...……更多
浪潮AI 人工智能“小源” 破“杀猪盘”诈骗套路
日前,由浪潮AI研究院研发的大规模中文语言模型“源1.0”在某次反诈行动中发挥出了出色的实效。期间,在“源1.0”的基础上,开发者开发了一个能够无障碍进行微信聊天的人工智能“小源”,并在与骗子的真实对话场景中进...……更多
小模型正在成为AI界的新宠
...特别是 GPU 和专用 AI 芯片(如 TPU)的发展,使得训练更大规模的模型成为可能;新的模型架构和训练技术的出现,如 Transformer 架构和预训练技术,使得模型能够更有效地扩展到更大的规模。此外,模型的大小往往被视为技术创...……更多
github发布2023年度开源状态报告
...有开发人员(92%)都在使用或尝试AI工具。开发人员正在大规模运行云原生应用程序:基于Git的基础设施作为代码(IaC)工作流程的声明性语言有所增加,云部署的标准化更广,开发人员使用Dockerfile和容器、IaC以及其他云原生技...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...元导读】Robin3D通过鲁棒指令数据生成引擎(RIG)生成的大规模数据进行训练,以提高模型在3D场景理解中的鲁棒性和泛化能力,在多个3D多模态学习基准测试中取得了优异的性能,超越了以往的方法,且无需针对特定任务的微调...……更多
【科技早报】神舟十七号发射圆满成功;苹果或将Vision Pro应用于心理健康领域
...提升,通过对预售包裹提前处理下沉到快递网点,实现更大规模的半日送达。菜鸟速递将继续把送货上门作为标配,同时菜鸟驿站继续在全国核心城市提供按需上门服务。(全天候科技) PayPal被罚逾9亿韩元,因泄露2.3万名用户...……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...述 “跷跷板式” 困境,实现了显著提升。该方法适用于大规模语言模型(LLMs)的预训练,在面向 Dense 模型和 MoE 模型的实验中,展示了显著性能提升效果,使预训练收敛速度最高可加速 80%。 研究团队还发现,超连接在两个小...……更多
面向“万星星座”专注卫星智能化管理 中科天塔完成近亿元A轮融资
...式已遇到“瓶颈”,依靠人力人工方式在未来将无法满足大规模星座的管理要求。因此,借助生成式人工智能(AI)技术对专家经验和垂直数据库进行标准化收敛、形成高稳定性、强专业性、高度自动化的大规模卫星智能测运控能...……更多
腾讯云向量数据库多项升级:最高支持千亿向量,一键打包开箱即用 | 最前线
...向量数据库标准,推进向量数据库及大模型相关产业走向大规模应用。腾讯云还与硬件厂商、大模型厂商、行业代表等联合成立了“AGI技术生态联盟”。来源:腾讯向量数据库可以说是大模型的数据“底层”,大模型若需要处理...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...然在理论和实验室环境中展现了巨大的潜力,但将其推向大规模商用并非易事。一个显著的挑战就是其高昂的计算和处理成本。Token的处理,涉及海量的数据分割、编码、解码以及跨模态的信息融合。这些操作需要强大的计算能...……更多
以“价值创造”为导向,医渡科技自研大模型即将发布
...智能领域深耕近10年,从解决数据可计算性,到安全可信的大规模计算,再到多任务的专业AI模型,医渡科技自主研发了自然语言处理平台、多中心加密安全计算平台和AI算法集,以及可解释、模型化知识图谱等一系列技术与产品,业务也...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...有前途的途径。报告指出,OpenAI研究了在视频数据上进行大规模训练的生成模型。具体而言,联合训练了文本条件扩散模型,该模型可处理不同持续时间、分辨率和长宽比的视频和图像。OpenAI利用了一种基于时空补丁的视频和图...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...级处理能力的任务。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力。Gemini Pro专为多...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...的大模型工程体系vivoAI工程架构专家陈崇沛分享了vivo在大规模高性能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的...……更多
更多关于科技的资讯:
冲泡即食、真材实料:海福盛冻干粥3.1元/杯大促
海福盛冻干粥5杯日常售价24.9元,今日下单可领6元优惠券,到手18.9元,包邮到家。购买链接:天猫(券后18.9元)下单赠送芙蓉鲜蔬汤一杯
2024-12-19 17:00:00
有效期3年:瑞慈全身体检套餐279元大促(立减800元)
天猫瑞慈体检旗舰店,成人全身体检套餐日常售价1079元,可领限量800元券,实付279元入手。全国66门店通用,有效期3年
2024-12-19 17:00:00
男子给已婚女同事发“么么哒”被辞退!法院判决:公司赔偿3万9
快科技12月19日消息,近日,据媒体报道,一则法院判决案例在网络流传,网文称安徽宣城一名“70后”男职工因给已婚女同事发“我想你”“么么哒”等聊天内容等原因遭到公司的辞退
2024-12-19 17:00:00
曝富士康已建立折叠屏iPhone测试线:厚度/重量尚未达到苹果标准
快科技12月19日消息,每年关于苹果的爆料,除了下一代iPhone之外,大家最熟悉的节目可能就是折叠屏iPhone了,年年都有传闻出现
2024-12-19 17:00:00
主人杀年猪 二哈偷吃猪肉被撑死:没有饱腹感、喂养需适量
12月19日消息,很多动物其实没有饱腹感,会一直进食,甚至有可能被撑死。近日在四川泸州,一户人家杀年猪,切好的肉放在桌子上
2024-12-19 17:00:00
中兴罕见涨停 股价创近一年来新高 夺A股成交冠军
快科技12月19日消息,作为A股硬科技领域的代表公司,中兴通讯今日盘中触及涨停板,股价创下近一年来的新高,总市值也重回1800亿元以上
2024-12-19 17:00:00
2024年,茅台悠蜜的美好遇见
营收连续5年蝉联第一。——在水果发酵酒领域,茅台悠蜜可谓是异军突起。12月18日,贵州茅台(集团)生态农业产业发展有限公司(以下简称“茅台生态农业公司”)2024年市场营销工作会议在贵阳市举行
2024-12-19 17:18:00
正安县中等职业学校:产教融合培育直播电商“新农人”
多彩贵州网讯 在当今数字化经济蓬勃发展的时代,直播电商作为一种新兴的商业模式,正以惊人的速度改变着人们的消费方式和市场格局
2024-12-19 17:19:00
远大医药获治疗干眼症的全球首创创新产品的独家开发及商业化权益
远大医药获得治疗干眼症的全球首创创新产品的独家开发及商业化权益OC-01和OC-02是两种高选择性的乙酰胆碱能受体激动剂
2024-12-19 17:21:00
@山东人:2024,你的钱都去哪了?参与调查赢奖品!
2024作为消费促进年,我国一系列促消费持续落地,有效释放了内需潜力,多数商品销售增势良好,升级类商品较快增长。根据国家统计局数据
2024-12-19 17:23:00
圣诞装蒂法3D模型分享:圣诞老人版“耶路撒泠”
随着圣诞节越来越近,“3D区”博主、模型渲染爱好者@DRAYQ今天在推特中分享了自己制作的圣诞装蒂法3D建模同人图。我们的“耶路撒冷”换上了圣诞老人短裙后像是要把衣服都要撑破了
2024-12-19 17:30:00
2026北京车展提前官宣:总面积超38万平米打破历史规模纪录
快科技12月19日消息,2026(第十九届)北京国际汽车展览会已正式定档。将于2026年4月24日至5月3日在北京中国国际展览中心(顺义馆)和首都国际会展中心(新国展二期)隆重举行
2024-12-19 17:30:00
余承东:很多车厂想和我们合作 抱歉 我手里没有那么多资源了
快科技12月19日消息,鸿蒙智行年度直播今日于海南三亚举办,余承东与四界老总相聚直播间,跟撒贝宁、尼格买提、陈伟鸿跨界对话
2024-12-19 17:30:00
鲜果酿造 口感纯正!云小耳黑莓果汁大促:48元券 6罐到手11.9元
云小耳黑莓果汁242ML*6罐日常售价为59.9元,下单领取48元优惠券,到手价为11.9元。购买链接:天猫(券后11
2024-12-19 17:30:00
商务部回应美方考虑禁售TP-Link路由器:别搞有罪推定
快科技12月19日消息,有报道称,美国商务部、国防部和司法部的调查人员以国安问题为由,已经对中国路由器品牌厂商TP-Link展开调查
2024-12-19 17:30:00