• 我的订阅
  • 头条热搜
b站开源轻量级index-1.9b系列模型,包含多个版本
...基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先。Index-1.9Bpure:基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于严格过滤了该版本语料中所有...……更多
利好不断的百度,能否撑起国产AI的门面?
...”却并不容易。中文因其特殊的语言情境,口语和方言的语料库较少、难以形成多模态语料库。并且国外主流大模型均以英文语料库为训练基础。以ChatGPT为例,训练数据中,中文语料比重不足千分之一,而英文语料占比超过92.6%...……更多
2024年宝山科创人才周启动,71项人才活动诚邀各方英才
...限公司CEO黄海清认为,机器人产业的发展离不开高质量的语料数据,而目前每家机器人创业公司的模型及语料数据标准并未统一,各家大模型训练的语料数据互不通用,造成各自的语料孤岛。当前发展人形智能机器人+大模型大...……更多
...秘了这群段子手的真实身份。段子为什么能作为训练AI的语料?在外滩大会的创新者舞台,弱智吧成员和AI专家进行了“脑洞”和理论的交锋。他们也同样疑惑,为什么许多AI公司会选择弱智吧作为语料库?无界方舟CEO曾晓东说,...……更多
“整活”保险业务,AI大模型哪家强?
...价值。 《报告》显示,由于国内大模型厂商在中文数据语料上更加丰富,因此国内头部大模型在回答专业领域的基础知识问询时,对国内情况更加了解,回答的表现也比国外大模型更加出色。“在知识问答方面,大模型可以帮...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...”AI正加速学习数学思维一旦AI能够阅读人类数学库中的语料,并掌握人类使用这些数学库的方法,或许它们将具备证明一些数学问题的能力不少数学家认为,在人工智能的帮助下,他们可能会获得更多的新发现。有些人甚至认...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...000张GPU,我们只要1200张。”Yi的训练数据主要来源于公开语料的爬取和数据库。李开复介绍,训练数据的难点在于重复率高、质量低。通过清晰,团队从100多T的数据中筛选出了3T。由于中文语料的质量较低,目前,Yi的训练数据...……更多
...建了藏文百科知识、新闻、经济、文化艺术等多领域文本语料40G以上,藏语语音数据15000小时、各类文化资源近2万件,规模达到1600GB,是目前国内外最大的基于国标的大型标注语料库,对中国涉藏地区教育、语言研究以及社会文...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。信也科技算法科学家倪博溢。10月24日,第八届信也科技杯算法大赛总决赛上,9支人工智能队伍角逐,探索利用AI技术识别和还原语音数据中的方言信息,...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...了文本到视频的渲染转换,更运用尖端算法精确抓取红色语料库素材,呈现可视化关键要点,相较于传统视频剪辑,大大提升了制作效率。 据了解,在同等条件下,按照传统视频剪辑制作流程计算,《AI绘轩辕》至少需要1-2个...……更多
香港首个基础大模型与凤凰卫视旗下机构达成战略合作
...。双方将联合打造多语言、多模态以及多元文化的高质量语料数据集,并探索合成数据加速大模型迭代的新模式,共同推动香港生成式人工智能的行业发展,加强华语文化对生成式人工智能领域的影响。签约仪式现场。受访方供...……更多
...关问题的专业能力,研发团队完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作,让“坤元”具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解...……更多
...经深入到网文创作中,据多位业内人士分析,直接宣布将语料“投喂”给大模型的平台, 目前仅有番茄小说一家,因此引发激烈抗议,“一些其他平台也有AI助手,但是以辅助写作的工具样式出现,比如帮助起名、描写场景等,...……更多
...了基于大模型技术的“个性化专家知识库”、“党媒数据语料治理”等四个创新应用;在平台服务方面,介绍了基于大模型的“内容供应链管理”“价值观大模型治理”两个平台服务。致力于提高内容创作效能,确保安全可控,...……更多
生成式AI创新游戏体验-亚马逊云科技助力沐瞳科技高效游戏运营
...进行识别。这种方式的缺点是无法及时学习新出现的辱骂语料,且受限于规则的构建者。而牧童采用了一种全新的、基于大模型的辱骂识别系统。该系统分为三个层级:第一级是基于关键词的过滤,将明确的辱骂内容直接过滤掉;第...……更多
智驭未来,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0
...更高质量、更高效率的数字化转型。“焱宇”聚焦高质量语料的精细化梳理和模型轻量化、可移动化,通过高质量数据治理、模型增强调优及自动化部署发布,让大模型在私有化环境的部署效率提升了750%,为行业智能化场景快...……更多
江苏大模型行业应用对接会举行 科大讯飞等落子南京玄武
...业发展的专项政策,聚焦服务平台搭建、备案资金奖补、语料数据分析、算力资源调度、高端人才引育等维度,拿出6000万元“真金白银”给予企业针对性的支持。后续还将联合科研院所和专业机构组建联合实验室,支持和鼓励...……更多
...成完成体。只不过,在训练机器人大脑的过程当中,数据语料成为了机器人的粮食。 “想要机器人像人类一样完成高质量的自主思考,必须要有高质量的语料喂给。”一家深圳人形机器人公司的技术人员告诉第一财经记者,当...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...要全行业共同参与,合作开发,“基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型”。以度小满的开源金融大模型“轩辕”为例,它是...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...用户-任务组合,LLM进一步生成了五个需要全面理解整个语料库才能回答的问题。通过这种方式,每个数据集最终产生了125个多样化的问题(5个用户 × 5个任务 × 5个问题),从而全面评估模型在处理各种查询时的能力。实现和评...……更多
制造业终于迎来大模型!上海工厂向东南亚梯度转移可能性靠此牢牢锁死?
...技术手段。另一方面,借助书生浦语大模型对高质量工业语料的训练,我们得以打造具有专业记忆力、高效计划力、可自主调用相应系统且能自动执行操作的人工智能体,且能多线作战,弥补老法师的稀缺以及偶尔的状态不在线...……更多
【观点摘登】高晓虹、白晓晴、崔林:以智能传播凝聚话语思想
...明的现代化实践具有普遍意义。生成式人工智能注重数据语料的丰富性与多样性,而智能传播仍然离不开议程设置与话题引导。(作者均系北京市习近平新时代中国特色社会主义思想研究中心特约研究员,分别系中国传媒大学电...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
...数据,并动态调整数据采样比例。 这让模型不再被初始语料集所限制,而是能够持续学习新引入的高质量数据,提升了语料覆盖面和泛化能力。同时通过调整采样比例,也有助于平衡不同数据源对模型性能的影响。△不同数据...……更多
奇瑞也造人形机器人?
...的过程中,强化自己的学习能力来理解和生成模型的全新语料库,实现更好的能力升级,为汽车领域的专业问题提供更加详细的答案。光有语言交互模型还远远不够,肢体动作和行为能力是评估人形机器人能力的重要指标。为此...……更多
B站公布了多项自主研发的AI技术成果和AIGC多元创意
...基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测基准上与同级别模型比处于领先Index-1.9Bpure:基座模型的对照组,与base具有相同的参数和训练策略,不同之处在于过滤了该版本语料中所有指令相...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...未来,AI将创造出一种新型的“人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据...……更多
圆桌|生成式AI时代,大模型数据安全如何保障?
...过训练去组合,去生成新的内容,这些内容可能在过去的语料里根本没出现过,但它依然是有害的。所以,即便把训练数据处理得很干净,在生成式人工智能时代依然会面临有害内容产生的情况。要解决这些问题,需要进行算法...……更多
中新经纬10月18日电 (孙庆阳) “基础大模型多数从通用语料训练生成,通识能力强,可作聊天对话,但缺少行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型。”10月17日,中国工程院院士、原中国互联网协会理...……更多
腾讯元宝“上桌”,AI助手之争再起波澜
...难追赶微信读书数百万正版图书的内容生态,这一高质量语料库,也将助力混元大模型深化专业知识能力。如今,全面接入微信搜一搜、搜狗搜索,内容覆盖微信公众号的腾讯元宝,将会进一步展现混元大模型在专属语料库上的...……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...机制。垂直大模型方面,其实建议,加快推动高质量垂类语料数据开放共享,进一步完善垂直大模型评测标准体系,并积极打造垂直大模型创新应用场景。支持链主企业开展早期风险投资其实表示,科技创新作为引领现代化产业...……更多
更多关于科技的资讯:
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00