• 我的订阅
  • 头条热搜
...京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去...……更多
千行百业加速拥抱大模型(AI前沿观察)
...云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》提出:“依托上...……更多
“整活”保险业务,AI大模型哪家强?
...方面的表现相对较好,因为其可以通过学习大量的数据和语料库来提供准确的答案。大模型不仅适合作为智能机器人用以服务客户,同时也可以赋能保险代理人。《报告》指出,在代理人渠道仍处于攻坚阶段的当下,大模型对于...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...。凤凰卫视融媒体研发副总经理冯伟表示,高质量的数据语料库是 AI 时代承载中华文化的新载体,凤凰数据的核心目标是为 AI 时代的中华文化传播奠定坚实基础,让 AI 与中华文化认知对齐更简单。据悉,2024 年,凤凰数据计划...……更多
“保险智能专家”在复旦诞生
...专用大语言模型。基于复旦保险多年沉淀积累的中文保险语料库,通过引入专家知识、构建思维链与LLM数据蒸馏的方式,构建了以保险知识问答、保险知识检索、保险案例分析、保险个性化服务等为基础任务的大语言模型训练数...……更多
...媒体行业的安全应用。生成式人工智能合规性评估体系和语料库由传播内容认知全国重点实验室于今年3月研究建立。目前,主流价值语料库的建设取得了阶段性进展,已完成3000多万篇基础语料、5万多道问答语料的建设工作。相...……更多
...“我们拥有的海量优质正版数据本身就是庞大且高质量的语料库,这将极大地提高训练模型的效果。此外,每天都会产生数以亿计的文字内容,并不断为模型研发注入数据能源。如果我们考虑音频和视频,中文在线的高质量数据...……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...。基于中文在线海量高质量正版中文网络文学图书、文献语料库,“中文逍遥”大模型已然成为中文创作领域“最能写”的AI助手。多:一张图片写一部小说创作是思考的过程。人类的思考载体不止于文字。实际上,人类对世界...……更多
热词生动记录中国人生活
...胺穿搭、命运的齿轮开始转动、新职人。专家表示,监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源,分析的语料规模超过80亿字符。王小岩认为,网络新词新语或是偶有出现的旧字新说,彰显出汉语的旺盛...……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...们必须正视,在国内主流模型训练中,中文数据集在全球语料库中只占据3%的份额,同时夹杂着网络垃圾数据,成为国内大模型发展与应用的一道枷锁。尤其是在不确定因素影响下,A100、A800、H100、H800、RTX 4090等芯片已成为产业...……更多
人民网科技公司发起成立“大模型责任联盟”
...记者“下笨功夫”,初步建成了专业人工问答的主流价值语料库,经过与主流大模型集成对接、验证,可以帮助大模型大幅提升价值观对齐水平。清华大学基础模型中心副主任黄民烈,哈尔滨工业大学人工智能研究院副院长车万...……更多
...境:“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用“智能信息处理技术结合领域专家意见和相关站点收录情况”的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见和相关站点收录情况的方式获得的。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。...……更多
沪指跌0.71%,创指跌1.85%:两市成交逾8500亿...
...跃题材哑火;传媒板块逆势走强,抖音概念股大涨,中文语料库、光刻机、旅游板块造好。至11月16日收盘,上证综指跌0.71%,报3050.93点;科创50指数跌1.67%,报887.11点;深证成指跌1.23%,报9954.4点;创业板指跌1.85%,报1978.12点。Wi...……更多
逾100万家数商企业崛起 中国如何发挥数据“乘数作用”?
...实并存,人工智能生成内容大模型所需要的海量和高标准语料库问题需要得到关注,“对中文来讲,挑战特别大,如果我们没有自己可信的、高质量的语料去‘喂’大模型,(未来虚拟世界)对中国的关注就会少很多。” ……更多
...构、企业等科研和产业数据共享开源,成立上海AI4S和AI4E语料库联盟与开发者社区,依托隐私计算、区块链、联邦学习等技术,构建安全可信的数据共享平台,使海量数据发挥更大作用。张磊说:“当下,最重要的莫过于要做两...……更多
宋丽云:做好新时代新征程网络文明建设者传播者捍卫者
...技成果。当前,人民网正在依托国重实验室建设主流价值语料库。此外,宋丽云推介了人民网的智能产品“天目”智能识别系统和“人民审校”。宋丽云说:“人民网将加大力度研发建设主流价值语料库,帮助国产AI系统建设安...……更多
标贝科技亮相全国人机语音通讯学术会议NCMMSC2023并发表主题演讲
...平台》的主题报告,和与会嘉宾分享的数据标注能力以及语料库建设成果。作为全国知名语音盛会,NCMMSC是国内语音领域广大专家、学者和科研工作者交流研究成果,促进该领域研究和开发工作不断进步的重要舞台,至今已成功召开...……更多
黄友义:中国式现代化需要对外话语体系 要善于用外语讲述中国故事
...文化的转换,另外则是打造一个更强大的介绍中国观点的语料库,给机器提供学习、提升翻译能力的机会。“要让机器帮助我们,我们必须首先帮助机器,给机器提供大量的语料库。但对外翻译不是靠少数人零敲碎打,这件事也...……更多
...普遍遇到优质语料短缺问题。人民网开发建设“主流价值语料库”,并通过与主流大模型的对接集成,验证了其有助于大幅提升大模型导向安全水平。事实一再证明,唯有技术与内容二者同频同向,构建起互促共进的正向互动关...……更多
易联众发布民生信息服务大模型平台,助推民生事业提质增效
...求意见稿)》,提出以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,加速通用大模型与垂直大模型的应用落地。民生领域中,人力资源和社会保障、医疗保障、卫生健康等服务在日常工作中存在高沟通频次,因而与大...……更多
...全国首款多模态交互式情感语言应用模型,在30多个国家语料库的基础上,应用TTS、ASR技术,不仅融合了丰富的语言数据,还整合了基于心理学量表模型库的分类算法,并向新型智能陪伴终端产品提供API引擎接口服务,目前已在...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见、相关站点收录情况的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。此...……更多
研究人员提出artprompt新大模型注入手段
...出不合规内容。这一研究表明,如果仅使用语义解释训练语料库,那么大语言模型会缺乏对非语义直接解释提示词的识别,暴露出的漏洞可通过ASCII字符画等形式利用。 ……更多
3500P算力就位!北京数据基础制度先行区扩至海淀
...挥智源前沿研究优势,凝聚行业力量,建设高质量大模型语料库,构建开源开放平台,推动通用人工智能技术及产业取得重大突破进行介绍。北京海天瑞声科技股份有限公司董事长贺琳表示将推动人工智能数据服务创新,积极参...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...000张GPU,我们只要1200张。”Yi的训练数据主要来源于公开语料的爬取和数据库。李开复介绍,训练数据的难点在于重复率高、质量低。通过清晰,团队从100多T的数据中筛选出了3T。由于中文语料的质量较低,目前,Yi的训练数据...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...Skywork-13B系列大模型还将开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用...……更多
360税务行业标准大模型入选人民网数造新实体典型案例
...税集团30多年涉税服务领域专业知识,搭建起完善的训练语料库,涵盖超百万法规、千万案例判例、万余本税务电子书以及百亿税务行业汉字集。据测试,税务行业标准大模型在注册税务师考试中的成绩已经超越了ChatGPT,获得业...……更多
“AI”当选柯林斯年度词汇
...技一般。”报道称,柯林斯表示,文字专家分析了柯林斯语料库,这个资料库涵盖超过200亿个单 字,其中包含来自全球各地网站、报章杂志和书籍的 书面资料。柯林斯也从广播、电视和日常对话搜集口语素材, 按月将新资料输...……更多
更多关于科技的资讯:
外星人 AW2725QF 26.5 英寸游戏显示器开售,5999 元
IT之家 8 月 22 日消息,外星人 AW2725QF 27 英寸 4K 游戏显示器现已开售,该款显示器支持 4K 180Hz 和 1080P 360Hz 两种显示模式
2024-08-23 09:37:00
历时 5 年技术攻关,我国成功研制首座超临界二氧化碳光热发电机组
IT之家 8 月 22 日消息,中国科学院电工研究所今天(8 月 22 日)发布博文,宣布我国首座超临界二氧化碳光热发电机组项目通过验收
2024-08-23 09:37:00
太阳能高空飞艇成功实现夜间悬停,可为偏远地区提供互联网
IT之家 8 月 22 日消息,一家名为 Sceye 的航空航天公司正在研制一种太阳能飞行器,旨在为偏远地区提供高速互联网服务
2024-08-23 09:39:00
曜越推出透视 The Tower 600 八角柱中塔 ATX 机箱,1199 元
IT之家 8 月 22 日消息,曜越今日推出其透视 The Tower八角柱机箱中的 ATX 规格型号The Tower 600
2024-08-23 09:39:00
realme 真我 Buds T310 耳机发布:46dB 混合降噪,199 元
IT之家8 月 22 日消息,realme真我 Buds T310耳机今日下午正式发布,首发价 199 元。这款耳机可选三种配色(莫奈紫
2024-08-23 09:39:00
AMD 酝酿 Win11 24H2 补丁,提振锐龙 9000 系列处理器游戏性能
IT之家 8 月 22 日消息,AMD 公司昨日发布社区博文,表示正酝酿新的 Windows 11 24H2 性能补丁
2024-08-23 09:39:00
Neuralink 二号患者恢复良好:能玩《CS2》、能 CAD 设计充电支架
IT之家 8 月 22 日消息,马斯克旗下脑机接口公司 Neuralink 昨日(8 月 21 日)发布博文,公布了 Prime 项目研究最新进展
2024-08-23 09:40:00
摆脱电池、电线束缚,采用无线供电的电子纸显示屏问世
IT之家 8 月 22 日消息,Digital View 推出了一款新型电子纸显示屏,与传统电子纸不同,其完全摒弃了电池
2024-08-23 09:40:00
无风扇复合散热,Nextorage 推出 USB4 移动固态硬盘 NX-PS1PRO
IT之家 8 月 22 日消息,日本 Nextorage 本月 19 日推出了NX-PS1PRO 系列移动固态硬盘。该移动固态硬盘采用盒线分离设计
2024-08-23 09:41:00
坐飞机可上网打电话,中国信科牵头制定国际标准
IT之家 8 月 22 日消息,中国信科集团 8 月 15 日对外披露,近日召开的国际电信联盟第十三研究组(简称 ITU-T SG13)瑞士日内瓦全会上
2024-08-23 09:41:00
抖音搜索推出独立 App
IT之家 8 月 22 日消息,据 Tech 星球报道,继头条搜索、悟空搜索、闪电搜索之后,抖音于近期推出第 4 个搜索类别的独立 App“抖音搜索”
2024-08-23 09:42:00
ATP 发布最耐用工业固态硬盘:工作温度范围 125°C、最高3.84 TB
IT之家 8 月 22 日消息,ATP Electronics 最新推出 N751Pi PCIe Gen 4 NVMe M
2024-08-23 09:42:00
文石A6护眼精读本发布:6寸墨水屏/安卓11系统,首发到手价1299元
IT之家 8 月 22 日消息,文石 BOOX 官微今天上午宣布,文石 A6 护眼精读本即日起正式发布,首发到手价 1299 元
2024-08-23 09:44:00
安卓版谷歌 Chrome 128 浏览器新特性:批量导入旧手机上的标签页
IT之家 8 月 22 日消息,科技媒体 Android Authority 今天(8 月 22 日)发布博文,表示安卓版谷歌 Chrome 128 浏览器测试引入了新的特性
2024-08-23 09:44:00
谷歌发布 Chrome 128 稳定版:引入隔离式 Web 应用等
IT之家 8 月 22 日消息,谷歌昨天发布博文,面向 Windows、macOS、Linux、安卓以及 iOS 平台发布 Chrome 128 稳定版更新
2024-08-23 09:44:00