• 我的订阅
  • 头条热搜
AI数据之战:大模型的“燃料”还能烧多久?
...版社之一西蒙与舒斯特公司。但作为人工智能大模型的“燃料”,高质量语料正在面临“枯竭”。加州大学伯克利分校计算机科学教授斯图尔特・罗素就曾发出警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段性突破至关重要。然而一个现实情况是,高质量语料正在被急速消耗。国内大模型厂商所面临的语料短缺问题十分严峻...……更多
千行百业加速拥抱大模型(AI前沿观察)
...技术与实体经济加速融合,应用场景十分广泛。 数据“燃料”加快共建共享数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今...……更多
...,越来越多的业内人士重新将目光投向驱动模型生成的“燃料”——语料。“大模型就像初生的孩子,教他学习、成长的课本就是AI语料,编纂教材的过程就是构建语料库的过程。”杭州城市大脑有限公司总经理申永生形象比喻...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开...……更多
重磅|标贝科技非平衡专业语料上线 助推GPT大模型技术应用落地
...日科技网】随着ChatGPT和GPT4.0的相继问世,拉开了大语言模型和生成式AI产业蓬勃发展的序幕。国内外各大企业和科研机构对ChatGPT的持续跟进,加速推进大语言模型的研发和产品化。目前市面上出现了诸多类ChatGPT大模型,功能层...……更多
上海:发力语料,建设“模都”
...、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模...……更多
...人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。库帕思公司董事长山栋明宣读倡议内容。大会主办方供图建立模型训练、语料供给、学术研究、...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
...专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质...……更多
首个语料库建设导则面世!近二十家企业共同发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。《语料库建设导则》发布。人民网记者 王初摄为实现“语料数据资源共建共享”“鼓励多元主...……更多
...融合都将是公司今年业务增量的发力点,其中积极建设AI模型训练的算料综合服务和交易平台,针对AI模型公司等下游客户销售和运营视频语料业务,是今年公司根据市场变化确定重点发展的方向之一。”4月30日,中广天择董事...……更多
“2024语料风云榜”发布,10家企业上榜!
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。为加速促进大模型语料生态企业按照高标准发现“好产品”、培育“好企业”,本次论坛上,大...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
人民中科董事长张丹:用技术为基层减负 运用人工智能“为民服务”
...发表主题演讲。主办方供图一是主流价值语料库。针对大模型普遍答不了、答不好的重大、敏感、疑难问题,人民网建设了包括基础语料、重点领域语料、敏感问答语料在内的主流价值语料库,目前已完成12万道题的问答语料库...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...工智能与数据服务业务群总裁唐鹏飞。行业数据是AI的“燃料” AI是数据的“大脑”“行业数据和AI之间的关系是相辅相成的。”唐鹏飞表示,AI系统通过对行业数据的学习和分析来发现模式、规律和趋势,这种行业知识驱动的学...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。语料运营平台1.0发布。大会主办方供图对照最高标准、最好水平,打造世界一流的语料枢纽,实...……更多
...作为神州数码生成式AI战略的核心产品、一站式企业级大模型集成平台,神州问学推出全方位、多层次的平台能力,实现了对计算资源的集成调用、大模型的集成调用、数据/语料治理和知识管理、快速低代码的应用搭建,有效解...……更多
AI赋能游戏:问答机器人的设计与实现
...半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。一...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
·确定一系列核心方言并为其建立自动语音识别(ASR)模型,当一种未知方言出现时,分析它距离这一系列核心方言中的哪些方言较近,就可以用合适的核心方言ASR模型识别出这种未知方言的内容。·方言应用的窗口期大约是二...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
香港首个基础大模型与凤凰卫视旗下机构达成战略合作
...及多元文化的高质量语料数据集,并探索合成数据加速大模型迭代的新模式,共同推动香港生成式人工智能的行业发展,加强华语文化对生成式人工智能领域的影响。签约仪式现场。受访方供图业内认为,凤凰智媒和香港生成式...……更多
邬贺铨院士:金融大模型改变了金融科技范式
...本文转自:光明网10月17日下午,百度世界·度小满金融大模型前沿发展论坛在北京召开,中国工程院院士邬贺铨在大会上表示“金融大模型改变了金融科技的范式,重塑金融行业的工作方式,改变了金融服务生态。”中国工程院...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
10月30日,昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Mat……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...《捉妖记》海报。 赵宜OpenAI开发的文(图)生视频模型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不...……更多
更多关于科技的资讯:
支持游戏《风暴之门》,英特尔发布 101.5768 WHQL 显卡驱动
IT之家 7 月 30 日消息,英特尔当地时间 29 日发布了英特尔 Graphics Driver 32.0.101
2024-07-31 09:22:00
软件无法检测到引擎盖未锁,特斯拉在美召回近 185 万辆汽车
IT之家 7 月 30 日消息,美国国家公路交通安全管理局(NHTSA)宣布:由于软件存在无法检测到引擎盖未锁的风险,特斯拉将在美国召回 1
2024-07-31 09:22:00
消息称台积电德国晶圆厂 8 月 20 日举行奠基仪式,魏哲家主持
IT之家 7 月 30 日消息,知情人士向《日经亚洲》透露称,台积电控股子公司 ESMC 将于 8 月 20 日举行德国德累斯顿晶圆厂的奠基仪式
2024-07-31 09:23:00
RTX AI 如何加速 CG 数字艺术创意落地
7 月 24 日,七彩虹、NVIDIA 以及 CG 职业教育品牌火星时代举办“RTX AI 创作加速体验区”落成仪式。NVIDIA Studio 生态合作经理曹梦琪女士
2024-07-31 09:24:00
美国科学家实现电动汽车无线充电新突破,功率高达270千瓦
IT之家 7 月 30 日消息,美国能源部橡树岭国家实验室(ORNL)近日成功演示了首个 270 千瓦的无线电动汽车(EV)充电技术
2024-07-31 09:32:00
星际荣耀完成JD-2发动机变推力高工况试车,助SQX-3火箭早日首飞
IT之家 7 月 30 日消息,星际荣耀公司宣布已于 7 月 29 日完成对 JD-2 发动机的变推力高工况试车,此次试车燃烧室压力达到额定工况的 111%
2024-07-31 09:32:00
自动驾驶扎堆IPO,文远知行能否成全球通用自动驾驶第一股?
近日,国内最早布局自动驾驶的公司之一的文远知行,向美国证券交易委员会递表,拟在纳斯达克上市,股票代码为"WRD"。若是顺利上市
2024-07-31 09:34:00
让“看不懂”的技术在这里落地生根,奉贤打造前沿科技转化首选地
为前沿科技转化投注“耐心资本”前不久,距离上海2000多公里外的云南省安宁市,一对夫妇终于迎来一个健康宝宝。夫妇俩均患有遗传性低碱性磷酸酶血症
2024-07-31 09:34:00
SpaceX 星舰静态点火测试成功,第五次试飞进入倒计时
IT之家 7 月 30 日消息,美国太空探索技术公司 SpaceX 近日成功对最新星舰上级火箭进行了发动机静态点火测试
2024-07-31 09:36:00
一块GPU都没用,苹果自研大模型干翻GPT-4?
智东西7月30日报道,当地时间7月29日,苹果发布iOS 18.1开发者测试版,上线Apple Intelligence的首个版本
2024-07-31 09:37:00
NVIDIA连甩多项NIM微服务!把生成式AI与USD打通了
智东西7月30日报道,在国际顶级计算机图形学会议SIGGRAPH 2024上,NVIDIA今日发布了通用场景描述(OpenUSD)的重大成果
2024-07-31 09:37:00
“清华系Sora”全球上线!首发实测:多镜头切换强到爆,30秒生成大片
最适合二次元的“国产Sora”来了!就在刚刚,清华系大模型创企生数科技,在全球范围上线视频生成模型Vidu,全面开放文生
2024-07-31 09:37:00
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
它来了它来了,苹果的Apple Intelligence终于与果粉见面了!随着iOS 18.1 Beta版的上线,注册开发者从即日起就能体验到苹果AI的部分功能
2024-07-31 09:39:00
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室
2024-07-31 09:39:00
首次杀入1999元 真正实现180度躺平清洁!云鲸智能洗地机F1冠军版评测
一、云鲸智能推出洗地机F1冠军版 带来三大优势随着生活节奏的加快,我们对家庭清洁的便捷性和效率的需求也在逐渐上升,尤其是年轻人
2024-07-31 09:42:00