• 我的订阅
  • 头条热搜
AI数据之战:大模型的“燃料”还能烧多久?
...版社之一西蒙与舒斯特公司。但作为人工智能大模型的“燃料”,高质量语料正在面临“枯竭”。加州大学伯克利分校计算机科学教授斯图尔特・罗素就曾发出警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段性突破至关重要。然而一个现实情况是,高质量语料正在被急速消耗。国内大模型厂商所面临的语料短缺问题十分严峻...……更多
千行百业加速拥抱大模型(AI前沿观察)
...技术与实体经济加速融合,应用场景十分广泛。 数据“燃料”加快共建共享数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今...……更多
...,越来越多的业内人士重新将目光投向驱动模型生成的“燃料”——语料。“大模型就像初生的孩子,教他学习、成长的课本就是AI语料,编纂教材的过程就是构建语料库的过程。”杭州城市大脑有限公司总经理申永生形象比喻...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开...……更多
重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...日科技网】随着ChatGPT和GPT4.0的相继问世,拉开了大语言模型和生成式AI产业蓬勃发展的序幕。国内外各大企业和科研机构对ChatGPT的持续跟进,加速推进大语言模型的研发和产品化。目前市面上出现了诸多类ChatGPT大模型,功能层...……更多
上海:发力语料,建设“模都”
...、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模...……更多
...人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。库帕思公司董事长山栋明宣读倡议内容。大会主办方供图建立模型训练、语料供给、学术研究、...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
...专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质...……更多
首个语料库建设导则面世!近二十家企业共同发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。《语料库建设导则》发布。人民网记者 王初摄为实现“语料数据资源共建共享”“鼓励多元主...……更多
...融合都将是公司今年业务增量的发力点,其中积极建设AI模型训练的算料综合服务和交易平台,针对AI模型公司等下游客户销售和运营视频语料业务,是今年公司根据市场变化确定重点发展的方向之一。”4月30日,中广天择董事...……更多
“2024语料风云榜”发布,10家企业上榜!
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。为加速促进大模型语料生态企业按照高标准发现“好产品”、培育“好企业”,本次论坛上,大...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
人民中科董事长张丹:用技术为基层减负 运用人工智能“为民服务”
...发表主题演讲。主办方供图一是主流价值语料库。针对大模型普遍答不了、答不好的重大、敏感、疑难问题,人民网建设了包括基础语料、重点领域语料、敏感问答语料在内的主流价值语料库,目前已完成12万道题的问答语料库...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...工智能与数据服务业务群总裁唐鹏飞。行业数据是AI的“燃料” AI是数据的“大脑”“行业数据和AI之间的关系是相辅相成的。”唐鹏飞表示,AI系统通过对行业数据的学习和分析来发现模式、规律和趋势,这种行业知识驱动的学...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。语料运营平台1.0发布。大会主办方供图对照最高标准、最好水平,打造世界一流的语料枢纽,实...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
大模型应用主战场真正热闹起来。上海汽轮机厂的设计师,再不会被一些重复低效环节辜负了才华。工厂一年要设计近150台套机组,30余位设计师的大量精力,曾耗在反复构建配件模型及修改草图上。但近期,工厂迎来一套基于...……更多
...作为神州数码生成式AI战略的核心产品、一站式企业级大模型集成平台,神州问学推出全方位、多层次的平台能力,实现了对计算资源的集成调用、大模型的集成调用、数据/语料治理和知识管理、快速低代码的应用搭建,有效解...……更多
AI赋能游戏:问答机器人的设计与实现
...半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。一...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
·确定一系列核心方言并为其建立自动语音识别(ASR)模型,当一种未知方言出现时,分析它距离这一系列核心方言中的哪些方言较近,就可以用合适的核心方言ASR模型识别出这种未知方言的内容。·方言应用的窗口期大约是二...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
香港首个基础大模型与凤凰卫视旗下机构达成战略合作
...及多元文化的高质量语料数据集,并探索合成数据加速大模型迭代的新模式,共同推动香港生成式人工智能的行业发展,加强华语文化对生成式人工智能领域的影响。签约仪式现场。受访方供图业内认为,凤凰智媒和香港生成式...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
更多关于科技的资讯:
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
继Devin之后,又一个AI软件工程师被刷屏了——它叫Genie,号称目前地表最强,已经可以像人一样思考和行动了!那么这个“地表最强”
2024-08-13 14:46:00
共享充电宝老大垂危:直营业务只剩运维 代理模式滋生严重乱收费
作为国内共享充电宝行业市占率最高的品牌,怪兽充电正陷入直营业务削减,代理业务问题频发的危机境地。近日,新浪科技获悉,怪兽充电正在大面积出售城市直营业务
2024-08-13 14:46:00
如何设置苹果手机呼叫转移:轻松管理来电转移
在使用苹果手机时,呼叫转移是一项非常有用的功能,它允许您将来电转移到其他电话号码或者语音信箱,确保您不会错过重要的电话
2024-08-13 14:46:00
轮船在晚上航行时,为什么不能开灯?难道在躲避什么东西吗?
夜深了,海面上泛起了层层细腻的波纹,月光轻轻洒落,给这浩瀚的蓝绸披上了一层银纱。就在这宁静而又神秘的时刻,一艘艘轮船悄无声息地穿梭其间
2024-08-13 14:46:00
steam服务器连接错误/服务器脱机怎么办?看解决方法
哎呀,遇到Steam服务器连接错误或者服务器脱机,就像是你正准备大展拳脚,突然发现你的超级英雄披风被调皮的猫咪藏起来了
2024-08-13 14:46:00
steam 免费优化工具?这个最好用
在这个数字化时代,随着网络游戏的盛行,一款优秀的优化工具对于游戏玩家来说至关重要。当谈及Steam免费优化工具时,UU无疑是一个值得推荐的选择
2024-08-13 14:47:00
AI智能网关 边缘计算 视觉AI
随着人工智能技术的不断发展,AI智能网关正成为连接现实世界和虚拟智能世界的重要桥梁。作为智能化时代的关键设备,AI智能网关在物联网
2024-08-13 14:47:00
中国江苏网8月13日盐城讯 随着互联网金融的不断发展,越来越多的客户选择使用数字化渠道办理金融业务,这对传统网点形成了巨大的竞争压力
2024-08-13 15:00:00
vivo Pad4系列测试开启,或首发搭载天玑9400芯片
8月12日,据@数码闲聊站发布的消息称,vivo已经开始测试搭载天玑9400芯片的平板电脑,或许会是全新的vivo Pad4 Pro
2024-08-13 16:42:00
价格更亲民的耐用战神 OPPO A3x评测
每年入门机都能够在整个手机市场中获得不错的销量,A系列是OPPO入门机产品线的代表,也是OPPO在线下市场的销售主力,最近动作频频
2024-08-13 16:42:00
抖音商城 App iOS 版试用:平平淡淡
今年 3 月,抖音商城 App 在小米、华为、OPPO、vivo 应用商店等安卓平台上线,这是抖音电商首次在抖音 App 之外推出的综合性独立电商平台
2024-08-13 16:49:00
微软新款Surface Pro 11评测,最适合办公族和学生党的笔记本它来了
为了便于我们效率的提升,平板笔记本电脑如今正当流行,在确保平板笔记本电脑性能的前提下,像轻量化设计、出色的便携、轻薄等优点
2024-08-13 16:50:00
据美国《财富》杂志12日援引彭博社的分析报道,美国沃尔玛等大型超市销售的一款非处方祛痰止咳药Mucinex可能含有致癌物质苯
2024-08-13 15:00:00
近年来,有关部门采取了一系列举措支持民营企业发展,进一步为民营企业解难题、提信心。聚焦高质量发展,民营企业如何立足自身行业进行融合发展
2024-08-13 15:05:00
中新经纬8月13日电 题:欧盟对AI立法,如何影响中国出海企业?作者 徐建华 中信建投证券ESG策略组首席分析师陈添奕 中信建投证券ESG策略组研究员欧盟《人工智能法案》(简称《法案》)在8月正式实施
2024-08-13 15:14:00