• 我的订阅
  • 头条热搜
AI数据之战:大模型的“燃料”还能烧多久?
...版社之一西蒙与舒斯特公司。但作为人工智能大模型的“燃料”,高质量语料正在面临“枯竭”。加州大学伯克利分校计算机科学教授斯图尔特・罗素就曾发出警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段性突破至关重要。然而一个现实情况是,高质量语料正在被急速消耗。国内大模型厂商所面临的语料短缺问题十分严峻...……更多
千行百业加速拥抱大模型(AI前沿观察)
...技术与实体经济加速融合,应用场景十分广泛。 数据“燃料”加快共建共享数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今...……更多
...,越来越多的业内人士重新将目光投向驱动模型生成的“燃料”——语料。“大模型就像初生的孩子,教他学习、成长的课本就是AI语料,编纂教材的过程就是构建语料库的过程。”杭州城市大脑有限公司总经理申永生形象比喻...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开...……更多
上海:发力语料,建设“模都”
...、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
星环科技创始人、CEO孙元浩:大数据与AI将深度融合|AI 领先者心声・2025
...、社会与生活的方方面面。刚刚过去的2024年,中外AI及大模型在技术与产业落地上取得了令人瞩目的进展。新的2025年,AI必将继续成为推动各行业变革的关键力量。 在2025新来来临之际,作为中国最大的财经媒体平台财联社携手...……更多
...人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。库帕思公司董事长山栋明宣读倡议内容。大会主办方供图建立模型训练、语料供给、学术研究、...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
...专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质...……更多
首个语料库建设导则面世!近二十家企业共同发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。《语料库建设导则》发布。人民网记者 王初摄为实现“语料数据资源共建共享”“鼓励多元主...……更多
...融合都将是公司今年业务增量的发力点,其中积极建设AI模型训练的算料综合服务和交易平台,针对AI模型公司等下游客户销售和运营视频语料业务,是今年公司根据市场变化确定重点发展的方向之一。”4月30日,中广天择董事...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户...……更多
“2024语料风云榜”发布,10家企业上榜!
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。为加速促进大模型语料生态企业按照高标准发现“好产品”、培育“好企业”,本次论坛上,大...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
人民中科董事长张丹:用技术为基层减负 运用人工智能“为民服务”
...发表主题演讲。主办方供图一是主流价值语料库。针对大模型普遍答不了、答不好的重大、敏感、疑难问题,人民网建设了包括基础语料、重点领域语料、敏感问答语料在内的主流价值语料库,目前已完成12万道题的问答语料库...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...工智能与数据服务业务群总裁唐鹏飞。行业数据是AI的“燃料” AI是数据的“大脑”“行业数据和AI之间的关系是相辅相成的。”唐鹏飞表示,AI系统通过对行业数据的学习和分析来发现模式、规律和趋势,这种行业知识驱动的学...……更多
深圳:每年发放最高5亿元“训力券”,降低人工智能模型研发...
...托重大项目资源,以创新方式支持企业低成本使用算力、模型、语料等人工智能服务资源。(责任单位:市发展改革委、市科技创新局、市工业和信息化局)(二)发放“训力券”。每年发放最高5亿元“训力券”,降低人工智...……更多
推动模塑申城语料普惠计划,百万具身智能数据集率先发布
...具身智能为核心方向,构建涵盖语料数据集、行业基座大模型和虚实融合训练场的“数据-模型-训练”技术矩阵,全面推动人工智能高水平集聚发展。在数据集建设上,聚焦复杂任务和真实场景,构建高质量、多样化的数据集,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。语料运营平台1.0发布。大会主办方供图对照最高标准、最好水平,打造世界一流的语料枢纽,实...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
大模型应用主战场真正热闹起来。上海汽轮机厂的设计师,再不会被一些重复低效环节辜负了才华。工厂一年要设计近150台套机组,30余位设计师的大量精力,曾耗在反复构建配件模型及修改草图上。但近期,工厂迎来一套基于...……更多
AI赋能游戏:问答机器人的设计与实现
...半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。一...……更多
...作为神州数码生成式AI战略的核心产品、一站式企业级大模型集成平台,神州问学推出全方位、多层次的平台能力,实现了对计算资源的集成调用、大模型的集成调用、数据/语料治理和知识管理、快速低代码的应用搭建,有效解...……更多
智驭未来,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0
...网大会乌镇峰会期间,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0,助力政企客户更高质量、更高效率的数字化转型。“焱宇”聚焦高质量语料的精细化梳理和模型轻量化、可移动化,通过高质量数据治理、模型增强调...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
更多关于科技的资讯:
浙江日报讯 (记者 翁云骞 通讯员 李芮) 日前,在宁波举办的2025空间计算大会上,全功能空间计算MR专用芯片“极智G-X100”发布
2025-12-05 09:14:00
三明联通将乐分公司:5G 护航“山水将乐·乐动心声”2025 文化惠民盛宴
网络保障团队开展通信服务。东南网12月5日讯(通讯员 肖锦雯)11月28日,“山水将乐·乐动心声”文化惠民活动在将乐县体育馆田径场盛大举行
2025-12-05 09:16:00
摘要:个性化推荐系统中,用户兴趣的动态演化特征对推荐效果有着直接影响。传统静态建模方法难以满足用户实时变化的偏好需求,兴趣演化建模应运而生
2025-12-05 09:26:00
“如果和父母只剩55天,你最想做什么?”面对这道假设题,许多人在调查问卷与访谈中写下了答案。我们根据回收的数据与采访实录
2025-12-05 10:15:00
中国网12月5日讯 据中国消费者协会官方网站消息,“双十二”购物旺季临近,各类促销活动密集,不少消费者早已选好想买的数码产品
2025-12-05 10:24:00
京东工业助力陕建打造供应链数据融合平台 赢得数据要素x大赛全国技术创新奖
近日,2025年“数据要素×”大赛全国总决赛成绩揭晓,京东工业携手陕建物流集团打造的“建筑行业供应链数据融合平台”项目
2025-12-05 10:58:00
据新华社消息 12月4日,在“AI·镜界—南京人工智能生态街区”,一位女士在“AI诊所”进行健康检测。近年来,江苏南京依托中国(南京)软件谷的软件产业基础
2025-12-05 09:41:00
河北日报讯(张晓超、崔虹)近日,第八届中国国际进口博览会在上海举办,河北省39家企业的70余类“燕赵好物”集中亮相,吸引了国内外客商的目光
2025-12-05 07:40:00
当人类基因组的30亿个碱基对如浩瀚星河般铺展,当大脑1000亿个神经元织就复杂网络,这本写满生命奥秘的“天书”,曾让科学家们望“脑”兴叹
2025-12-05 07:42:00
12月3日上午,一票跨境电商网购保税进口商品经杭州海关所属义乌海关审核验放后,从义乌保税物流中心发往购买的消费者手中。值得注意的是
2025-12-04 09:42:00
腾讯游戏魔方工作室迎来十五周年,《暗区突围》手游爆料地图更新
12月3日,腾讯游戏魔方工作室迎来十五周年庆。魔方多款游戏主创来到直播现场爆料,为玩家带来产品最新进度,备受玩家关注的《洛克王国》IP新作《洛克王国
2025-12-04 14:20:00
从日常随拍到户外探索 年轻人用手持设备定格热爱
脚踩陆冲板的年轻人手持全景相机,以第三人称视角“跟拍”运动瞬间;旅行博主捕捉下360°无死角的风景,剪辑时通过手动调整视角制作出炫酷转场
2025-12-04 14:20:00
在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
中国移动AI听障康复智能体落地 为2780万听障人士架起沟通桥梁
12月3日是国际残疾人日。当日早间,央视财经频道《第一时间》重磅报道了中国移动自主研发的全国首个AI听障康复智能体——“中移无障碍”
2025-12-04 15:22:00
防沉迷+护安全,墨宝·AI学生机成未成年人用机优选
在数字化设备快速发展的当今,未成年教育正面临着网络沉迷、电子产品使用导致近视等前所未有的挑战。那么,究竟有没有科学、有效且合理的解决方案呢
2025-12-04 15:23:00