• 我的订阅
  • 头条热搜
星环科技成功举办数据要素市场与大模型语料库论坛
...司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。上海市经信委信息化推进处处长...……更多
千行百业加速拥抱大模型(AI前沿观察)
...云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》提出:“依托上...……更多
人民网科技公司发起成立“大模型责任联盟”
...记者“下笨功夫”,初步建成了专业人工问答的主流价值语料库,经过与主流大模型集成对接、验证,可以帮助大模型大幅提升价值观对齐水平。清华大学基础模型中心副主任黄民烈,哈尔滨工业大学人工智能研究院副院长车万...……更多
...京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质量可信数据,经过去...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...。凤凰卫视融媒体研发副总经理冯伟表示,高质量的数据语料库是 AI 时代承载中华文化的新载体,凤凰数据的核心目标是为 AI 时代的中华文化传播奠定坚实基础,让 AI 与中华文化认知对齐更简单。据悉,2024 年,凤凰数据计划...……更多
逾100万家数商企业崛起 中国如何发挥数据“乘数作用”?
...实并存,人工智能生成内容大模型所需要的海量和高标准语料库问题需要得到关注,“对中文来讲,挑战特别大,如果我们没有自己可信的、高质量的语料去‘喂’大模型,(未来虚拟世界)对中国的关注就会少很多。” ……更多
APUS李涛阐述AI战略:为中国定制AI大模型,让大模型应用与价值创造接轨
...们必须正视,在国内主流模型训练中,中文数据集在全球语料库中只占据3%的份额,同时夹杂着网络垃圾数据,成为国内大模型发展与应用的一道枷锁。尤其是在不确定因素影响下,A100、A800、H100、H800、RTX 4090等芯片已成为产业...……更多
...细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。在保障支撑方面,《征求意见稿》提出提升数据供给水平。完善数据资源体系,...……更多
...媒体行业的安全应用。生成式人工智能合规性评估体系和语料库由传播内容认知全国重点实验室于今年3月研究建立。目前,主流价值语料库的建设取得了阶段性进展,已完成3000多万篇基础语料、5万多道问答语料的建设工作。相...……更多
“整活”保险业务,AI大模型哪家强?
...方面的表现相对较好,因为其可以通过学习大量的数据和语料库来提供准确的答案。大模型不仅适合作为智能机器人用以服务客户,同时也可以赋能保险代理人。《报告》指出,在代理人渠道仍处于攻坚阶段的当下,大模型对于...……更多
...构、企业等科研和产业数据共享开源,成立上海AI4S和AI4E语料库联盟与开发者社区,依托隐私计算、区块链、联邦学习等技术,构建安全可信的数据共享平台,使海量数据发挥更大作用。张磊说:“当下,最重要的莫过于要做两...……更多
3500P算力就位!北京数据基础制度先行区扩至海淀
...挥智源前沿研究优势,凝聚行业力量,建设高质量大模型语料库,构建开源开放平台,推动通用人工智能技术及产业取得重大突破进行介绍。北京海天瑞声科技股份有限公司董事长贺琳表示将推动人工智能数据服务创新,积极参...……更多
研究人员提出artprompt新大模型注入手段
...出不合规内容。这一研究表明,如果仅使用语义解释训练语料库,那么大语言模型会缺乏对非语义直接解释提示词的识别,暴露出的漏洞可通过ASCII字符画等形式利用。 ……更多
...,依托国家权威机构,汇聚多模态制造业数据,构建行业语料库,降低预训练门槛,提升大模型的准确性和稳定性。促进制造业数据高效流通,加快数据交易市场建设,培育一批面向制造业大模型的服务商和交易所,有效盘活制...……更多
...境:“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用“智能信息处理技术结合领域专家意见和相关站点收录情况”的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源...……更多
“数据要素×”三年行动计划征求意见:到2026年底数据产...
...细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。 在数据要素×商贸流通方面,提到拓展新消费,鼓励各类商贸经营主体、相关...……更多
易联众发布民生信息服务大模型平台,助推民生事业提质增效
...求意见稿)》,提出以科学数据支持大模型开发,建设高质量语料库和基础科学数据集,加速通用大模型与垂直大模型的应用落地。民生领域中,人力资源和社会保障、医疗保障、卫生健康等服务在日常工作中存在高沟通频次,因而与大...……更多
AI手机成行业新风口,但实际体验却频频翻车
...有限所致。有资料显示,GPT-3的知识来自3000亿单词的训练语料库,其中六成左右来自于2016年-2019年的C4语料库(全网部分文本快照),22%来自于WebText2(Reddit网站内3分以上的回答整理而来的数据集)。360CEO周鸿祎认为,中国大模...……更多
2023年度十大科技名词揭晓!你都知道哪些?
...个阶段。其内容采集覆盖全网,基于政府工作报告、新闻语料库、学术数据库、百科知识库、社交媒体、搜索指数等多元数据源,充分发挥参与各机构的丰富资源和专业优势,以确保选出的科技名词不仅具有时代意义,还反映广...……更多
“保险智能专家”在复旦诞生
...专用大语言模型。基于复旦保险多年沉淀积累的中文保险语料库,通过引入专家知识、构建思维链与LLM数据蒸馏的方式,构建了以保险知识问答、保险知识检索、保险案例分析、保险个性化服务等为基础任务的大语言模型训练数...……更多
宋丽云:做好新时代新征程网络文明建设者传播者捍卫者
...技成果。当前,人民网正在依托国重实验室建设主流价值语料库。此外,宋丽云推介了人民网的智能产品“天目”智能识别系统和“人民审校”。宋丽云说:“人民网将加大力度研发建设主流价值语料库,帮助国产AI系统建设安...……更多
中国科技创新“乘”数直上
...和多来源知识融合,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展人工智能大模型开发和训练。近年来,中国在大模型领域拥有良好的算力基础和广阔的市场,国产大模型频频亮相、加速迭代。工业和...……更多
标贝科技亮相全国人机语音通讯学术会议NCMMSC2023并发表主题演讲
...平台》的主题报告,和与会嘉宾分享的数据标注能力以及语料库建设成果。作为全国知名语音盛会,NCMMSC是国内语音领域广大专家、学者和科研工作者交流研究成果,促进该领域研究和开发工作不断进步的重要舞台,至今已成功召开...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见和相关站点收录情况的方式获得的。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。...……更多
...“我们拥有的海量优质正版数据本身就是庞大且高质量的语料库,这将极大地提高训练模型的效果。此外,每天都会产生数以亿计的文字内容,并不断为模型研发注入数据能源。如果我们考虑音频和视频,中文在线的高质量数据...……更多
APUS成为深圳市人工智能行业协会理事单位,CEO李涛受聘专家
...PUS大模型坚持积累面向中国市场的、价值观正向的“红色语料库”,以打造符合中国需求与价值观准确的AI大模型,创造可用、可靠的新AI生产力,体现了行业高度和专业素养。经协会研讨决定,聘用李涛为协会专家委员会专家...……更多
...普遍遇到优质语料短缺问题。人民网开发建设“主流价值语料库”,并通过与主流大模型的对接集成,验证了其有助于大幅提升大模型导向安全水平。事实一再证明,唯有技术与内容二者同频同向,构建起互促共进的正向互动关...……更多
...分,“2023年度十大网络用语”是基于国家语言资源监测语料库网络媒体部分,采用智能信息处理技术结合领域专家意见、相关站点收录情况的方式获得。监测语料库中包含了视频弹幕、网络新闻等不同媒体形式的语言资源。此...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上采样。” 返回搜狐,查看更多责任编辑: ……更多
3大关键词,解读全球首个万字创作大模型“中文逍遥”
...。基于中文在线海量高质量正版中文网络文学图书、文献语料库,“中文逍遥”大模型已然成为中文创作领域“最能写”的AI助手。多:一张图片写一部小说创作是思考的过程。人类的思考载体不止于文字。实际上,人类对世界...……更多
更多关于科技的资讯:
国内首个水稻主效功能基因分子模块育种芯片在鄂研发成功
10月12日,极目新闻记者从湖北省科技厅获悉,近日由湖北省科技厅科技重大专项支持的国内首个水稻主效功能基因分子模块育种液相芯片“稻功芯一号”研发成功
2024-10-14 17:10:00
飞机上的6种“隐藏”服务,全部免费,只要主动开口,空姐是不会拒绝的
随着人们生活质量的提升,乘坐飞机已经成为了不少人出行的第一选择,这不但会节约我们在路上的时间,而且会体验到空姐带给我们优质的服务
2024-10-14 17:10:00
人类真的是进化来的?有没有可能是某个高级文明创造出来的?
现代科学的共识是,人类与黑猩猩共享一个远古祖先,大约600万年前,人类与黑猩猩在漫长的进化长河中分道扬镳,各自演变为截然不同的物种
2024-10-14 17:10:00
在深圳光明正式启用!推进国产高端医疗影像设备研发制造
推进国产高端医疗影像设备研发制造,加快发展新质生产力,深圳市光明区引进的重点企业——国药通用(深圳)医疗影像有限公司于去年底注册成立
2024-10-14 17:11:00
子力制冷 | 模温机的日常维护保养如何做好?
在工业生产中,模温机作为关键设备之一,其稳定性和可靠性对于生产效率和产品质量至关重要。因此,模温机的日常维护保养显得尤为重要
2024-10-14 15:59:00
森派克公司的超高温设备海外扩张【CVD、碳纯化炉】
(keyword:SiC/TaC/B4CCVD,化学气相沉积炉,碳純化炉,石墨化炉,热压炉)随着全球半导体、二次电池、电动汽车
2024-10-14 16:08:00
全球口碑好的NMN六大品牌,消费者评分五星以上的品牌有哪些?
一、美国W+(端粒塔)美国W+(端粒塔),作为全球健康科技领域的璀璨明星,其产品足迹遍布36个国家,深受国际市场的认可
2024-10-14 16:15:00
江苏银行管家服务又添一员!通过运用大数据与人工智能技术,江苏银行推出保函管家,为企业客户提供一站式保函服务,为助力企业数字化发展贡献力量
2024-10-14 16:38:00
山东移动滨州分公司倾情助力2024滨州半程马拉松
鲁网10月14日讯“申恒杯”2024滨州半程马拉松暨好运山东·马拉松城市联赛(滨州站)于10月13日7:30在滨州黄河三角洲交易中心正式开跑
2024-10-14 16:43:00
爱他美至熠中国首发,配方采用全球首创 “3D乳黄金球”
近日,达能在中国首发爱他美至熠婴幼儿配方奶粉,该产品不仅采用全球首创专利“3D乳黄金球”,还添加了5种高量HMO和爱他美专利共生元旗舰组合——母源益生菌加科学配比益生元
2024-10-14 16:44:00
全新升级,洛微发布高性能3D工业相机,为机器视觉注入新动能
10月14日,VisionChina2024(深圳)于深圳国际会展中心盛大开幕,作为机器视觉与自动化领域的盛会,VisionChina汇聚了众多行业顶尖的视觉技术与应用成果
2024-10-14 16:45:00
键德探针台厂家|探针台按实现目标功能不同怎么划分?
探针台属于整个测试系统的基础,没有探针台,就相当于医生没有了手术台,在普通的病床上给病人做手术,将极大地增加手术风险。那么探针台按实现目标功能不同怎么划分呢
2024-10-14 16:52:00
钛动科技:如何玩转海外TikTok营销
随着全球数字化进程的加快,TikTok已成为品牌营销的重要平台,尤其是在年轻消费者中,其用户数量和活跃度不断攀升。2024年上半年《TikTok生态发展白皮书》显示
2024-10-14 17:00:00
键德测试测量|高低温探针台有哪些分类?
高低温探针台是一种用于信息科学与系统科学领域的工艺试验仪器,主要用于测试不同环境、不同温度条件下微结构半导体器件、微电子器件及材料电学特性表征
2024-10-14 17:03:00
武汉高仕达电气:智驭未来,电力科技的创新引擎
在武汉市东湖新技术开发区的璀璨星光中,武汉高仕达电气有限公司(简称“高仕达电气”)犹如一颗冉冉升起的新星,以其独特的创新视角和深厚的技术底蕴
2024-10-14 17:03:00