• 我的订阅
  • 头条热搜
...智能对话,知识储备非常重要。“这就需要不断给她喂‘语料’。‘喂’得越多,数字人越聪明。”陈超俊说,图片、文档、语音、视频,都可以成为“数字人老板娘”的“语料”。我在电子版浙江日报上,搜集了一些关于义乌...……更多
...、财务、人力资源、维修等场景,施耐德电气沉淀了大量语料与经验,有望未来优先从如企业内部知识管理、智能知识问答等产品与场景做切入。而作为首批入选“国家级工业设计中心名单”的企业,海尔创新设计中心选择亚马...……更多
北大字节VAR最佳论文、厦大清华亚军,NeurIPS 2024最佳论文出炉
...的作者首先做出了一个假设:「对于语言模型训练,并非语料库中的所有 token 都同等重要」。然后,他们分析了语言模型的 token 级训练动态,结果发现不同 token 有着不同的损失模式。基于这些见解,他们开发了一种新模型 RHO-1...……更多
世界智能驾驶挑战赛吹响“集结号”(图)
...语义理解等任务的智能化水平,基于用户场景需求,生成语料库和测试评价维度,确定测评指标层级及其权重,对搭载大模型的车型进行深度横评,通过测试积累相关数据,为车企提供行业参考。以市场上正常销售或拟上市的量...……更多
工业机器人炫技有点酷
...机器人拥有语言理解和文本生成能力,会通过链接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得机器人具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与人类几乎无异的聊天场景进...……更多
逾100万家数商企业崛起 中国如何发挥数据“乘数作用”?
...实并存,人工智能生成内容大模型所需要的海量和高标准语料库问题需要得到关注,“对中文来讲,挑战特别大,如果我们没有自己可信的、高质量的语料去‘喂’大模型,(未来虚拟世界)对中国的关注就会少很多。” ……更多
...境:“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用“智能信息处理技术结合领域专家意见和相关站点收录情况”的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源...……更多
...构、企业等科研和产业数据共享开源,成立上海AI4S和AI4E语料库联盟与开发者社区,依托隐私计算、区块链、联邦学习等技术,构建安全可信的数据共享平台,使海量数据发挥更大作用。张磊说:“当下,最重要的莫过于要做两...……更多
最强数学大模型易主!阿里千问新模型成绩超GPT-4o
...造而成。在基础模型之上,团队使用精心设计的数学专用语料库进行了预训练,训练数据包含大规模高质量的数学网络文本、书籍、代码、考试题目,以及由Qwen2模型合成的数学预训练数据。结果,在GSM8K、MATH等经典数学测试集...……更多
...型训练数据的全生命周期进行严格的监控和管理,对数据语料进行更严格的智能治理;其次,通过“以模制模”的方法,即利用人工智能技术来解决人工智能带来的数据安全问题,具体而言,要构建专用的、规模较小的专业大模...……更多
易联众发布民生信息服务大模型平台,助推民生事业提质增效
...求意见稿)》,提出以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,加速通用大模型与垂直大模型的应用落地。民生领域中,人力资源和社会保障、医疗保障、卫生健康等服务在日常工作中存在高沟通频次,因而与大...……更多
...学院国家天文台共同打造,拥有700亿参数、320亿tokens文本语料,经过了1万道天文学评测数据集的测评,是当前天文知识能力最强的大语言模型。作为天文学的“新质生产力”,AstroOne将促进学科交叉、突破领域边界,探索未知领...……更多
全自主知识产权!华为、华西医院共同发布“华西黉医”医学大模型
...模型生产线和应用生产线。这些生产线实现了多模态医疗语料的智能化标注、多个大模型的统一管理和调度,以及生成式病历等应用的快速开发。比如病历生成由医生手动输入改为大模型自动生成,门诊病历生成时间从传统数分...……更多
...国内人工智能大模型在价值观对齐过程中,普遍遇到优质语料短缺问题。人民网开发建设“主流价值语料库”,并通过与主流大模型的对接集成,验证了其有助于大幅提升大模型导向安全水平。事实一再证明,唯有技术与内容二...……更多
持续打造能用好用的数字模型
...和丰富赋能成效。目前,上海市检察院已加入中国大模型语料数据联盟,将继续探索法律文书自动生成等多模态应用,借助机器深度学习,不断拓展模型的覆盖面,持续打造检察人员能用好用愿用的模型。 ……更多
...“我们拥有的海量优质正版数据本身就是庞大且高质量的语料库,这将极大地提高训练模型的效果。此外,每天都会产生数以亿计的文字内容,并不断为模型研发注入数据能源。如果我们考虑音频和视频,中文在线的高质量数据...……更多
元宇宙:过气网红,不入寒冬
...于深度学习的自然语言处理技术,其核心是使用大规模的语料库进行训练,从而实现对语言的生成和理解。ChatGPT在处理自然语言时,通过将人类语言转化为计算机可理解的代码,实现了对人类语言的深度理解和生成。以ChatGPT为...……更多
...有限公司研发训练的大语言模型,采用1.5万亿Tokens中英文语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将AI大模型...……更多
...是数据制胜,即以高质量的安全专业数据和事件数据作为语料,并配合专业的技术手段对模型进行训练。第二,在场景上,要立足小切口、大纵深方法论,以安全难点小场景切入,做深做透。第三,在大模型设计上,采用类脑分...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上采样。” 返回搜狐,查看更多责任编辑: ……更多
3400多只股票上涨,120多个涨停,沪指重返3400点
...A股热点不断另外,教育、文化传媒、游戏、培育钻石、AI语料、人工智能、冰雪产业等板块涨幅居前;PEEK材料、海南自贸区、人形机器人、光伏设备、电机等板块跌幅居前。外盘看涨截至14:00,富时中国A50指数期货涨幅1.11%。MSCI...……更多
...行董事兼总经理杜嘉说,这些数据集对于目前的AI大模型语料训练、数字图书馆建设、数字教育内容资源建设等可以发挥积极的作用,期待与贵数所协力共赢,共创数据要素新篇章。 ……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
...求模型同时具备数学和编程能力,那些在高度专业化代码语料库上训练的模型,在MA领域往往表现较差。这一结果进一步证明,FullStack Bench能够更全面地评估模型的综合编程能力。跨语言表现:C++、C和Ruby上存较大差异研究团队...……更多
金域医学域见医言大模型正式发布,提速智慧医检4.0时代
...据和知识积累,以及23000家医疗机构的服务经验,在通用语料基础上注入了超20亿Token(数据单元)医检语料,经过近两年的开发训练而成。目前已有超2万名企业专业技术人员、临床专家、检验医师参与测试。该模型可望支持整...……更多
...分身应用于新闻播报、内容分享等场景;建设高质量数据语料库,推动以大模型为代表的人工智能技术在媒体领域的创新与场景应用。为让城市治理更高效,智媒实验室将建立智能系统平台,通过分析民情民意数据,把脉社会治...……更多
如何让大模型输出更精准、更可靠的结果?
...赛博坦平台设定线上智能客服的角色、性格,并上传大量语料形成知识库,在RAG的助力下,该机构智能客服与用户的交互变得十分顺畅和丝滑,此前“答非所问”的情况大为改观。03透明可追溯RAG技术另外一项优势就是知识的可...……更多
...浦动的预训练过程融合了羽毛球专家知识库和专业评论员语料资源,从而能实现实时、科学的技战术分析解读。 ……更多
...加速增长,中国网络空间安全协会发布首批120G中文基础语料,北京市发布两批人工智能大模型高质量数据集,数据总量规模超612TB。全国一体化政务服务平台数据共享枢纽累计发布数据资源2.06万类,支撑各地区各部门共享调用53...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见和相关站点收录情况的方式获得的。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。...……更多
“Chat两会”智答热点AI与你无限畅聊
...法等大模型的通用特性,基于大量准确、专业的两会报道语料数据,训练出的一个适用于省两会新闻报道的专业大模型。“Chat两会”具备多模态理解、内容生成、智能交互等AI核心能力,将进一步推动省两会报道智能化,提升用...……更多
更多关于科技的资讯:
中新经纬11月19日电 中国疫苗行业协会微信公众号19日发布《关于反对“内卷式”竞争 促进疫苗及其相关生物制品行业高质量发展的倡议》(下称《倡议》)称
2025-11-19 17:36:00
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00