• 我的订阅
  • 头条热搜
...普遍遇到优质语料短缺问题。人民网开发建设“主流价值语料库”,并通过与主流大模型的对接集成,验证了其有助于大幅提升大模型导向安全水平。事实一再证明,唯有技术与内容二者同频同向,构建起互促共进的正向互动关...……更多
...知识库并进行精细的运营管理,同步管理大型模型训练的语料库。在智能客服应用场景中,AI驱动的客户联络平台可一站式接入,实现7*24小时保持客户联络,并串联企业全业务场景,实现售前、售中、售后全场景覆盖。值得一...……更多
...分身应用于新闻播报、内容分享等场景;建设高质量数据语料库,推动以大模型为代表的人工智能技术在媒体领域的创新与场景应用。为让城市治理更高效,智媒实验室将建立智能系统平台,通过分析民情民意数据,把脉社会治...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见、相关站点收录情况的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。此...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长度最长的。360表示,他们在OpenCompass的主流...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上采样。” 返回搜狐,查看更多责任编辑: ……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...、药品等领域的百亿级中英文图文资料,千亿级医疗文本语料库,以及千万级高质量医疗知识图谱,其学习深度与广度均达到业界领先水平,甚至在中英文医疗考试与基准测试中展现出与GPT-4相媲美甚至超越的性能。这一多模态...……更多
《历史铸就统一体》等中国自主的知识体系成果发布
...中国外语教育研究中心研究员刘鼎甲发布《中国英汉平行语料库研究》著作成果。该书是国家社科基金重大项目“大规模英汉平行语料库的建立与加工”的重要成果,荣获第九届高等学校科学研究优秀成果奖一等奖。“中国英汉...……更多
AI已读乱回、自作主张……多位博主“被坑”!有人忍不住关闭功能
...发众怒。当年6月,微软公开解释小冰骂人的原因,称其语料库来自大数据公开信息,尽管已经反复过滤和审核,但依旧会有约十万分之四的脏话信息被吸收。微软还重申:“相比较人类在日常对话中使用脏话的频率,小冰已经...……更多
2023内容科技应用典型案例:“人民审校”智能涉政审校系统
...准定位信息中存在的风险问题。文本智能审校:持续丰富语料库资源,构建涉政信息垂直领域知识图谱,强化自然语言处理,深度赋能智能算法学习升级迭代,助力一键文本审校更加精准化、迅捷化、专业化。图片智能审校:综...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...人工智能安全治理专业委员会首批成员单位,参与大模型语料库和安全评测。 ……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...用户-任务组合,LLM进一步生成了五个需要全面理解整个语料库才能回答的问题。通过这种方式,每个数据集最终产生了125个多样化的问题(5个用户 × 5个任务 × 5个问题),从而全面评估模型在处理各种查询时的能力。实现和评...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...。基于中文在线海量高质量正版中文网络文学图书、文献语料库,“中文逍遥”大模型已然成为中文创作领域“最能写”的AI助手。多:一张图片写一部小说创作是思考的过程。人类的思考载体不止于文字。实际上,人类对世界...……更多
...全国首款多模态交互式情感语言应用模型,在30多个国家语料库的基础上,应用TTS、ASR技术,不仅融合了丰富的语言数据,还整合了基于心理学量表模型库的分类算法,并向新型智能陪伴终端产品提供API引擎接口服务,目前已在...……更多
研究人员在电子邮件中使用ascii艺术
...邮件中写道,ArtPrompt暴露出的问题是,LLM被训练为假定\"语料库\"(意指书面文本的集合)应该\"纯粹从词义或语义的角度进行解释\"。然而,对语料库的解释有可能超越语义学的范畴。ArtPrompt要求LLMs完成两项任务,即识别ASCII艺...……更多
“什么值得买”助力提升海螺AI消费决策体验:输出垂类能力,建设融合生态
...和沉淀,有海量的商品数据、用户评价、购买指南等优质语料库,还有自主研发消费大模型的实战经验,这些正好能和我们实现优势互补,创造更好的用户体验,实现更大的商业化价值。”王云峰表示,“很荣幸这次成为MiniMax...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...存在显著的性能差距,尤其在处理更多样化或异质的训练语料库时,这一差距会进一步扩大。语料库的异质性意味着数据集的多样性,由于内容和风格各异,往往会引入干扰。PEFT 方法对此尤为敏感,在异构情况下性能损失更为...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...-STaR的具体性能,研究使用了可用的最佳开放语言模型Lean语料库 (InternLM2-Math-base-7b) 上进行预训练,并遵循Lean的Mathlib作为底层训练集的标准实践。首先以LeanDojo Benchmark 4 v9作为监督微调(SFT)数据集,包含超过23.1万个示……更多
360税务行业标准大模型入选人民网数造新实体典型案例
...税集团30多年涉税服务领域专业知识,搭建起完善的训练语料库,涵盖超百万法规、千万案例判例、万余本税务电子书以及百亿税务行业汉字集。据测试,税务行业标准大模型在注册税务师考试中的成绩已经超越了ChatGPT,获得业...……更多
AI赋能智慧服务,嘉银科技推出“女娲”坐席辅助平台
...服团队积极拥抱AI变革,探索AI应用,并成立专项小组,推进语料库建设、模型验证、业务运营,力求精益求精,给客户带来优质高效的服务。未来,嘉银科技将继续加强自主研发能力建设,持续迭代优化产品、服务和技术能力。乘着人工...……更多
值得买科技发布全面AI战略,AI驱动的电商变革者?
...方面,AIGC的研发和应用需要基于海量优质的数据资源和语料库,而这正是值得买科技的优势,来自过去数年的积累。与此同时,在此次战略发布会上,“1个大模型、2个数据库、3个引擎、4类应用”组成的值得买科技AI产品矩阵...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...这类模型专注于特定行业的需求,通过使用高质量的行业语料库进行训练,以实现对行业知识的深入理解和应用。浙江大学人工智能研究所所长、求是特聘教授、国家杰青获得者吴飞分享了智海系列垂直领域大模型与人工智能体...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...了重大突破。它采用了更先进的预训练技术,通过大规模语料库的学习,使得模型在理解和生成文本的能力上达到了新的高度。此外,Qwen2.5还特别注重多语言支持和跨文化适应性,这使得它在全球化应用方面具有独特的优势。 ...……更多
马斯克旗下人工智能大模型Grok已正式开源
...服务访问。然而,Grok 的开源并不包括其训练数据的完整语料库,也不提供对 X 上可用的实时信息的访问。用户仍然需要订阅 X 的付费版本。Grok 被定位为 OpenAI 的 ChatGPT 和其他领先的谷歌AI的竞争对手。它以意为理解的俚语命名...……更多
南工大学生设计出一款魔镜,能瞬间“读”出你的心情
...情绪识别。“语音频谱图的语音数据集选自CASIA汉语情感语料库,它是由中国科学院自动化所录制,包括四个专业发音人,生气、高兴、害怕、悲伤、惊讶和中性等六种情绪,共4800句不同发音。”团队成员彭华东介绍。如此,“...……更多
用AI识别AI:西湖大学一项研究可高效检测AI生成文本
...器则更倾向于选择有更高模型概率的词汇,因为在大规模语料库上预训练的AI模型反映的是人类的集体写作行为,而非个体行为。” 鲍光胜解释,“具体而言,两种文本在词汇使用、句子结构、语法复杂度、语义连贯性等方面有...……更多
...开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反映了人类的性别、伦理和道德偏见。伦敦大学学院信息学系博士生奥利维娅·麦克米伦-斯科特问道:“它们是否也反映了人类在推理测试中的认知偏差?”她...……更多
热词生动记录中国人生活
...胺穿搭、命运的齿轮开始转动、新职人。专家表示,监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源,分析的语料规模超过80亿字符。王小岩认为,网络新词新语或是偶有出现的旧字新说,彰显出汉语的旺盛...……更多
...学习框架等底盘和基础性共性关键技术,建设高质量国家语料库,实现软硬件全栈式能力覆盖。强化前瞻引领性研究,力争在前沿领域抢占制高点。瞄准可能引发人工智能变革的颠覆性方向,加强人工智能与数学等相互促进,突...……更多
2023内容科技应用典型案例:人民日报创作大脑AI+发布
...、促进生成式人工智能在媒体行业的安全应用的主流价值语料库建设,展现出其助力用主流价值导向驾驭算法的能力与潜力。(天津大学新媒体与传播学院院长陆小华) ……更多
更多关于科技的资讯:
卫星瞰中国 | 太空存档里的中国答卷
本文转自:人民网 苍穹之眼解码大地脉动,跃动的中国答案永不停歇!出品人:叶蓁蓁总策划:赵强总监制:宋丽云 孙海峰统筹
2025-03-11 10:39:00
吉利申请注册DEEPSTEP商标
吉利申请注册DEEP系列商标天眼查知识产权信息显示,近日,浙江吉利控股集团有限公司申请注册“DEEPSTEP”“DEEPINTELLIGENT”“DEEPTRAIL”商标
2025-03-11 10:41:00
2024年,我国每天花掉98亿搞科研
《中国研发经费报告2024》显示,2024年,我国研发经费投入超3.6万亿元。比上年增长8.3%,尽管增速有所放缓,但依然实现了“十四五”规划中全社会研发经费投入年均增长7%以上的目标
2025-03-11 10:42:00
百花齐放,全球迎来中国潮
当《哪吒2》以148.9亿票房,登上全球票房榜前6,以东方美学颠覆好莱坞动画叙事;全球马力排名中位列第二的小米SU7 Ultra赢得海内外一片好评
2025-03-11 10:45:00
理想高管再谈与力帆关系:约等于手机号码前机主和你的关系
快科技3月11日消息,近日,“理想汽车是力帆车”的谣言一直在网上流传,理想汽车产品线负责人汤靖多次在微博发文辟谣。10日深夜
2025-03-11 10:48:00
鸿蒙智行法务部:正式起诉自媒体“我是大彬同学”
快科技3月11日消息,鸿蒙智行法务官微刚刚发布微博,称正式起诉自媒体“我是大彬同学”。鸿蒙智行法务称,根据网友最近提供的线索
2025-03-11 10:48:00
曾致超200人死亡的危地马拉火山再喷发:灰柱高达7000米
快科技3月11日消息,据央视新闻报道,当地时间3月10日,危地马拉民防部通报,位于首都危地马拉城西南部的富埃戈火山当日凌晨开始大规模喷发
2025-03-11 10:48:00
创新之光耀时代,三思科技启新篇
——上海三思以"新质生产力"书写高质量发展答卷春潮澎湃处,扬帆奋进时。2025年全国两会再次将“加快发展新质生产力”“强化科技创新核心地位”置于战略高位
2025-03-11 11:01:00
AI、消费、出海、新能源……2025商业风向标,看36氪超能直播月!
与36氪一起,追问本质,主动破局。
2025-03-11 12:07:00
靠一杯火鸡面,三养如何敲开大学生宿舍的 “美食大门”
“碰个面”构建校园社交新纽带,“撒疯辣”释放青春活力正值开学之际,三养重磅推出“三养碰个面,开学撒疯辣”全国校园活动,抓住新学期学生结交朋友
2025-03-11 13:10:00
国泰航空加码本土化战略:内地员工规模2025年将达4000人
2025年3月8日,国泰航空于上海举办首次内地雇主品牌推广活动——“国泰招聘体验日”,吸引数百名求职者参与。“背靠祖国”战略
2025-03-11 11:11:00
仅需一个开源工具:大部分游戏都能用AMD FSR4
快科技3月11日消息,AMD最新推出的FSR 4技术为游戏玩家带来了显著的性能提升,但其仅支持最新的RX 9070系列显卡
2025-03-11 11:18:00
宇树科技头戴式智能装置专利获授权:缓解长期佩戴导致的颈椎酸痛
快科技3月11日消息,今日,据天眼查知识产权信息显示,杭州宇树科技有限公司申请的“一种适配头戴式设备的重力补偿机构和头戴式智能装置”专利获授权
2025-03-11 11:18:00
苹果AI中文版终于来了:iOS 18.4 Beta 3上线
快科技3月11日消息,据媒体报道,苹果面向开发者推送了iOS 18.4 Beta 3版本,新版iOS加入了苹果AI中文版
2025-03-11 11:18:00
不止卷智驾!曝新款比亚迪秦L EV有望搭载800V+5C超充
快科技3月11日消息,据媒体报道,比亚迪正集中升级纯电新车的快充能力。其中,新款秦L EV将支持800V+5C超充,有望成为800V超充方案中最便宜的车型
2025-03-11 11:18:00