• 我的订阅
  • 头条热搜
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...eta和Llama团队对开源的巨大贡献"。他表示:"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物。"图源:网络总的来说,Llama3.1模型有以下几个特点:1.包含8B、70B和405B三个尺寸,最大上下文提升到了128K,支持多语...……更多
阿里云首席技术官周靖人:阿里云已搭建完善的AI大模型训练平台
...的快速的发展。”周靖人表示。据他介绍,继数月前发布通义千问1.0大模型后,今天下午阿里云将发布新的通义千问2.0大模型,进行更加重量级的升级,此外还会发布一系列的行业模型,有效的帮助开发者在各行各业利用人工智...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...,大模型是新时代的计算机,就如同中央处理器一样;而上下文窗口可以看做计算机的内存,存储了当下正在处理的文本。互联网实时信息与企业完整知识库,则共同构成大模型时代的硬盘。而基于搜索增强技术推出的API系列,...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...过程中在这些角色之间无缝切换,利用其自回归能力根据上下文预测下一个token。推理过程始于提议者引入一个命题,向DAG添加一个节点。然后,由评论者评估验证或提供批评。如果提供了批评,将添加一个新节点,并在该命题...……更多
史无前例!Seq2Seq和GAN同获NeurIPS时间检验奖,Ilya连续2年获奖
...码器(Encoder):将输入序列逐步编码为一个固定长度的上下文向量。编码器逐一接收输入序列的元素(例如单词),并通过LSTM的隐藏状态逐渐生成该上下文向量。 解码器(Decoder):基于编码器生成的上下文向量,解码器逐步...……更多
三维天地AI智能体应用落地场景:敏感数据识别
...类型数据及其所在位置,难以提供更多与网络安全相关的上下文信息。数据安全管理人员不得不手动检查新记录并收集缺失的信息,这种依赖人工的方式不仅效率低下,很可能因人为疏忽引入错误,影响数据安全防护的准确性和...……更多
chatgpt爆火刷屏!华为称相关大模型领域早有布局
...通过学习和理解人类的语言来进行对话,并能根据聊天的上下文进行互动,真正像人类一样来聊天交流 ……更多
大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora
...说地更具体点。训练 Vidu 大模型需要长序列训练和较大的上下文窗口,百舸创新提供了序列并行策略、显存优化策略,还支持超长上下文训练。作为结果,大模型训练中最费时间的渲染环节,效率提升了 3 倍。同时,通过优化数...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长...……更多
...其境的震撼体验。阿里巴巴集团(展位号:7C11)打造的通义大模型互动体验区,设计了AIGC邮筒、通义App、钉钉AI助理等一系列场景应用体验项目。大家可以感受通义千问在创意文案、办公助理、学习助手、趣味生活等多方面的...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...…简单来说,越来越像一位真正的人类助手了。Gemini 1.0上下文窗口为32k,基于谷歌自家的TPUs v4 和 v5e进行大规模训练。这次,谷歌顺势推出了新的TPU 系统 Cloud TPU v5p,希望为训练AI模型的客户提供支持。△Google 数据中心内,一...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
...道宣布将开源有道速读背后的RAG引擎“QAnything”。阿里云通义千问APP上线免费功能“通义舞王”36氪获悉,阿里云通义千问APP上线免费功能“通义舞王”,用户在通义千问APP内输入“通义舞王”“全民舞王”等口令后,即可进入...……更多
腾讯Angel机器学习平台获世界互联网大会领先科技奖
...的开源MoE模型混元Large,总参数量 389B,激活参数量 52B ,上下文长度高达256K,其训练和推理均基于腾讯Angel机器学习平台。 ……更多
...司大语言模型3-80亿参数版本),在中文上优于Qwen1.5-72(通义千问1.5-72)。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中...……更多
...操作记录)进行分析与计算,以便更好地理解所提问题和上下文语境,从而提供更具有相关性的信息。同时,大模型还会基于所收集的数据以及模型生成的对应回复,用于模型训练,从而不断调整优化模型的效果。后续还将扩展...……更多
Meta推出Llama 3,号称“最强开源大模型”
...这比Llama2使用的数据集大7倍,代码也多出4倍,支持的8K上下文长度也是Llama2容量的两倍。Llama3与竞争对手的对比Meta还在Llama3的开发中采用了多种创新技术,包括数据并行化、模型并行化和管道并行化,极大提高了训练效率。同...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...2 个。 旋转位置嵌入大小为 6144,与输入嵌入大小相同。上下文长度为 8192 tokens,精度为 bf16。此外还提供了一些权重的 8bit 量化内容。当然,我们还是希望 xAI 官方能够尽快公布 Grok-1 的更多模型细节。Grok-1 是个什么模型?能...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...几个月中,他们预计将推出新功能(如多模态)、更长的上下文窗口、更多不同大小版本的模型和更强的性能,以及 Llama 3 研究论文。另外,Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Micr……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...转化为指令跟随的格式。为了充分利用大语言模型强大的上下文学习能力,研究人员使用ChatGPT,通过为每个任务定制的特定提示工程模板来多样化指令的语言风格。 将这些与现有基准的原始训练集相结合,研究人员构建了百万...……更多
智能客服大模型的发展趋势
...个性化的回答。它能够自动识别客户的情绪和语义,根据上下文进行智能推测,并快速解决问题。智能客服大模型的优势智能客服大模型相比传统客服有许多优势:快速响应:智能客服大模型能够实时接收和回应大量用户的消息...……更多
华藏生态共创,为大模型商业变现注入活力
...华藏的图生文(VQA)能力也可圈可点,不仅具备文本间的上下文能力,还具备图文间的上下文能力,比如与图对话、根据图片内容生成描述等。针对华藏多模态能力的商业变现,华藏与合作伙伴共创了模特生成和试衣平台,突破...……更多
AI大模型开启“免费午餐”?字节直降99%,阿里一折甩卖,百度高喊免费!
...价降低99.3%。几天后,阿里、百度纷纷跟上,阿里官宣9款通义大模型降价,通义千问GPT-4级大模型Qwen-Long直降97%。5月21日,百度直接宣布两款主力模型免费。不过目前,华为、腾讯暂时按兵不动。面对当前的降价形势,一名业内...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
...大模型具解析、理解、推理及生成能力。同时,大模型对上下文理解能力的突破,也使设计工程师得以用自然语言与大模型交互。 上海汽轮机厂智能出图项目由设序科技支撑,公司首席产品官杨庆保告诉记者,设计师们操作鼠...……更多
...例分析得十分在理,直观且很好理解。同样的问题询问了通义千问、文心一言、讯飞星火等AI模型,大部分AI回答正确并给出了详细的答题过程。为什么一道小学数学题难倒了部分AI大模型?昨天上午,通义实验室产品经理王晓明...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...当时中国最大参数开源。2024年1月,元象又开源全球最长上下文窗口大模型,支持输入25万汉字,还附手把手训练教程,让大模型应用一举进入“长文本时代”。此次国内最大参数MoE开源,又是给生态贡献了一个助推低成本AI应用...……更多
生成式AI时代的业务流程管理变革,BPM迎来大型流程模型
...流程模型定义(比如重新设计招聘流程等)、在业务流程上下文中生成实际内容(比如自动创建的职位描述等)以及详细阐述文档和数据(比如总结客户支持交互等)来实现。第三种类型,与生成式AI提高专业和公民开发人员的...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...归一化。因此,模型输出对数概率。在动作 - 值预测中,上下文大小为 79,而在状态 - 值预测和行为克隆中,上下文大小为 78。对于动作和状态 - 值预测,输出大小为 ,对于行为克隆,输出大小为 1968(所有可能合法动作的数量...……更多
更多关于科技的资讯:
聚焦服务品质 福州千名经纪人共赴贝壳福州站搏学大考
贝壳福州站搏学大考考场11月19日,贝壳找房福州站第26届新经纪品牌搏学大考正式拉开序幕,福州数千名房产经纪人通过线下机考的形式完成了本届搏学大考
2025-11-20 13:38:00
当输入一句简单指令,AI就能在几秒内给新鲜水果添上霉斑、给完好衣物制造破洞,这样的技术能力如今却成了少数人薅商家羊毛的利器
2025-11-20 11:16:00
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00