• 我的订阅
  • 头条热搜
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见和相关站点收录情况的方式获得的。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见、相关站点收录情况的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。此...……更多
...境:“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用“智能信息处理技术结合领域专家意见和相关站点收录情况”的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源...……更多
热词生动记录中国人生活
...胺穿搭、命运的齿轮开始转动、新职人。专家表示,监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源,分析的语料规模超过80亿字符。王小岩认为,网络新词新语或是偶有出现的旧字新说,彰显出汉语的旺盛...……更多
“汉语盘点2023”在京启动 12月20日揭晓年度字词
...字词为活动预热。国家语言资源监测与研究中心通过监测语料库,推荐国内字“新、复、合、兴、路”和国际字“战、乱、变、债、危”,国内词“一带一路、全球文明倡议、文心一言、亚运会、绿色发展”和国际词“巴以冲突...……更多
...京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去...……更多
年度热词,生动记录社会生活
...说,这些词语由国家语言资源监测与研究中心基于大数据语料库选取,语料库包含主流媒体、网络媒体、广播电视媒体和社交媒体等语言资源,每年语料有20多亿字的文本,然后利用语言信息处理技术筛取,经过专家评议选出。...……更多
网络热词“魅力”当选牛津年度词
...这种造词法在英语中不太多见。声明说,牛津大学出版社语料库数据显示,这个词2023年使用频次显著增加,尤其在今年6月。当时,曾出演《蜘蛛侠》系列影片的英国演员汤姆·赫兰德在采访中被问到保持魅力的秘诀。赫兰德回...……更多
“AI”当选柯林斯年度词汇
...技一般。”报道称,柯林斯表示,文字专家分析了柯林斯语料库,这个资料库涵盖超过200亿个单 字,其中包含来自全球各地网站、报章杂志和书籍的 书面资料。柯林斯也从广播、电视和日常对话搜集口语素材, 按月将新资料输...……更多
宋丽云:做好新时代新征程网络文明建设者传播者捍卫者
...技成果。当前,人民网正在依托国重实验室建设主流价值语料库。此外,宋丽云推介了人民网的智能产品“天目”智能识别系统和“人民审校”。宋丽云说:“人民网将加大力度研发建设主流价值语料库,帮助国产AI系统建设安...……更多
...2023年度中国媒体十大新词语”是基于国家语言资源监测语料库,利用语言信息处理技术,结合后期人工确认获得的。语料来源于2023年1月1日至11月30日的10份主流报纸的文章、20家电台和电视台的节目、4家门户网站的新闻,数据...……更多
千行百业加速拥抱大模型(AI前沿观察)
...云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》提出:“依托上...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长...……更多
...媒体行业的安全应用。生成式人工智能合规性评估体系和语料库由传播内容认知全国重点实验室于今年3月研究建立。目前,主流价值语料库的建设取得了阶段性进展,已完成3000多万篇基础语料、5万多道问答语料的建设工作。相...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是还有更多宝藏数据资源值得深挖?近日,由中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...容有更多被采集、使用和预训练的可能。参与国家级中文语料库建设,成为重要的语料建设者。整个社区的激进 AI 化。AI 进行提问,更负责回答。知乎社区将出现大量的 AI 数字人作为独立的 IP ——历史的、科技的、医学的、文...……更多
黄友义:中国式现代化需要对外话语体系 要善于用外语讲述中国故事
...文化的转换,另外则是打造一个更强大的介绍中国观点的语料库,给机器提供学习、提升翻译能力的机会。“要让机器帮助我们,我们必须首先帮助机器,给机器提供大量的语料库。但对外翻译不是靠少数人零敲碎打,这件事也...……更多
【聚焦2024中关村论坛】数据安全治理与发展论坛举行:发布7项实践成果
...数字经济高质量发展提供有力保障。成果二:中文互联网语料库CCI 2.0北京智源人工智能研究院发布中文互联网语料库CCI 2.0,规模约500G,且为经过严格清洗过滤的中文数据集。CCI 2.0在1.0版本基础上,进一步扩充数据来源、完善...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...右我们对世界的认识方式。 文化出海应包括数据出海,语料库是未来文化软实力如果仔细分析Sora生成内容的美学要素,就能够轻易发现,它的审美范式依旧是这一“犹他大学—好莱坞—皮克斯”系统的延续。不仅Sora所代表的...……更多
“整活”保险业务,AI大模型哪家强?
...方面的表现相对较好,因为其可以通过学习大量的数据和语料库来提供准确的答案。大模型不仅适合作为智能机器人用以服务客户,同时也可以赋能保险代理人。《报告》指出,在代理人渠道仍处于攻坚阶段的当下,大模型对于...……更多
APUS带你穿越千载重回故里,看AI眼中的《轩辕大帝》
...了文本到视频的渲染转换,更运用尖端算法精确抓取红色语料库素材,呈现可视化关键要点,相较于传统视频剪辑,大大提升了制作效率。 据了解,在同等条件下,按照传统视频剪辑制作流程计算,《AI绘轩辕》至少需要1-2个...……更多
...普遍遇到优质语料短缺问题。人民网开发建设“主流价值语料库”,并通过与主流大模型的对接集成,验证了其有助于大幅提升大模型导向安全水平。事实一再证明,唯有技术与内容二者同频同向,构建起互促共进的正向互动关...……更多
...要实践成果包括北京市数据跨境便利化实践、中文互联网语料库CCI 2.0、数据认证实践和展望、北京人工智能数据训练基地监管沙盒、北京市高级别自动驾驶示范区数据安全治理白皮书、生成式人工智能安全风险测评平台及大赛...……更多
沪指跌0.71%,创指跌1.85%:两市成交逾8500亿...
...跃题材哑火;传媒板块逆势走强,抖音概念股大涨,中文语料库、光刻机、旅游板块造好。至11月16日收盘,上证综指跌0.71%,报3050.93点;科创50指数跌1.67%,报887.11点;深证成指跌1.23%,报9954.4点;创业板指跌1.85%,报1978.12点。Wi...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上采样。” 返回搜狐,查看更多责任编辑: ……更多
2023年度十大科技名词揭晓!你都知道哪些?
...个阶段。其内容采集覆盖全网,基于政府工作报告、新闻语料库、学术数据库、百科知识库、社交媒体、搜索指数等多元数据源,充分发挥参与各机构的丰富资源和专业优势,以确保选出的科技名词不仅具有时代意义,还反映广...……更多
2023 年度热词,只能是它
...的使用量大幅增加,但在 2022 年之前,它甚至很少出现在语料库里。 与 AI「聊出来」的作品,是否算作人类的创作?11 月底,AI 生成图片著作权侵权第一案的一审落幕,给出了一个可能的答案,判决的依据就和提示词有关。原...……更多
...频词,将它们以语块的方式呈现出来,建立了“高中英语语料库”,分单元编写成词汇学案,便于学生学习拓展。“语块其实就是将那些高频词组成短语或短句。”为将语料库真正运用到教学中,赵春丽又对老师们进行培训,告...……更多
...;“传统礼俗与武陵民族地区乡风文明建设研究”“基于语料库的中医词汇在日本的流变研究”“武陵山区民俗体育文化助力乡村治理研究”获批2023年国家社科基金西部项目。 ……更多
...构、企业等科研和产业数据共享开源,成立上海AI4S和AI4E语料库联盟与开发者社区,依托隐私计算、区块链、联邦学习等技术,构建安全可信的数据共享平台,使海量数据发挥更大作用。张磊说:“当下,最重要的莫过于要做两...……更多
更多关于科技的资讯:
华为新专利公开!攻克硅基负极电池体积膨胀难题
快科技11月16日消息,日前,华为一项全新的硅基负极材料专利公开,名称为《硅基负极材料及其制备方法、电池和终端》。该专利主要解决了硅基材料因膨胀效应过大导致电池循环性能低的问题
2024-11-16 14:51:00
刀尖上跳舞 顺丰12小时极速护送2000公里
快科技11月16日消息,日前,清华大学药学院实验室急需一批冻存胚胎干细胞,要求在11月5日8点前必须送达北京。此次任务非常特殊
2024-11-16 14:51:00
端到端大模型到底是个啥 小米官方详解
快科技11月16日消息,小米HAD(Xiaomi Hyper Autonomous Driving)将全面接入端到端大模型
2024-11-16 15:21:00
李可 报道 通讯员 曲和钊今年以来,郓城农商银行积极响应“金融强国”战略部署,以数字化金融转型为契机,向“数”而行,深度聚焦场景应用
2024-11-16 15:36:00
业界唯一!华为数据湖打通孤岛 让数据永远在线
快科技11月16日消息,日前在人口健康科学数据创新发展与应用大会(2024)上,华为公司副总裁、数据存储产品线总裁周跃峰博士表了《华为医疗多模态人工智能数据基础设施建设思考》的主题演讲
2024-11-16 16:21:00
卢伟冰:小米15吸引大批iPhone用户 这四点无法拒绝
快科技11月16日消息,卢伟冰在微博中提到,除了小米的老用户外,从iPhone转换到小米的新用户数量最多。他进一步解释说
2024-11-16 16:21:00
70余项数据资源围绕企业运行,“沂蒙慧眼”11月13日上线
11月15日,记者从临沂市人民政府新闻办公室新闻发布会获悉,沂蒙慧眼(企业精准“画像”)系统已完成一期建设,并于11月13日正式上线
2024-11-16 16:44:00
10万元的车也能原地转圈 广州车展宝骏悦也秀肌肉
快科技11月16日消息,提到汽车原地转圈,很多人首先会想到的是那些价值百万级别的豪华车型。然而,在最近的广州车展上,这一印象被彻底颠覆了
2024-11-16 16:51:00
刘经南:遥感监测技术在碳中和领域发挥关键作用
本文转自:人民网-广东频道人民网阳江11月16日电 (宁玉瑛)11月16日,2024大湾区科学论坛绿能产业科技创新分论坛在广东阳江海陵岛举行
2024-11-16 17:09:00
一等奖五万元,潍坊风筝标识设计大赛面向全球征集作品
为持续擦亮“世界风筝都”名片,提升“潍坊风筝”品牌影响力,增强城市辨识度和竞争力,赋能更好潍坊建设,潍坊风筝标识设计大赛组委会决定于2024年11月15日起面向全球启动潍坊风筝标识设计大赛
2024-11-16 17:18:00
第二十五届中国冷博览会在长沙开幕 推动制冷产业不断向前发展
本文转自:人民网-湖南频道展会现场。受访单位供图人民网长沙11月16日电 11月15日,第二十五届中国制冷、空调、热泵
2024-11-16 17:57:00
vivo X200系列推送系统更新:减弱眩光问题
快科技11月16日消息,vivo X200系列发布之后,拍摄眩光问题引起热议,尤其Pro版本。当时官方承诺将OTA优化
2024-11-16 12:21:00
《白夜追凶》续集来了 白夜破晓全阵容官宣:潘粤明等原班人马
快科技11月16日消息,“白夜追凶”官微发布了续集《白夜破晓》的全阵容,据悉,该剧的领衔主演包括潘粤明、王龙正、梁缘,均为《白夜追凶》里的原班人马
2024-11-16 12:21:00
上门喂养宠物平台有哪些?在外时候选宠拉达宠物上门喂养照顾宠物
在现代社会,随着宠物在家庭中的地位日益提升,越来越多的宠物主人开始关注如何在自己外出时,依然能够给予宠物最好的照顾。为此
2024-11-16 13:07:00
坐稳30万级六七座销冠:奶爸车理想L8累计销量超20万台
快科技11月16日消息,理想汽车公布品牌旗下车型L8的最新销量成绩,自从上市以来,累计交付超20万台,成为了30-40万价位六七座车型的销冠
2024-11-16 13:21:00