• 我的订阅
  • 头条热搜
AI数据之战:大模型的“燃料”还能烧多久?
...版社之一西蒙与舒斯特公司。但作为人工智能大模型的“燃料”,高质量语料正在面临“枯竭”。加州大学伯克利分校计算机科学教授斯图尔特・罗素就曾发出警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段性突破至关重要。然而一个现实情况是,高质量语料正在被急速消耗。国内大模型厂商所面临的语料短缺问题十分严峻...……更多
千行百业加速拥抱大模型(AI前沿观察)
...技术与实体经济加速融合,应用场景十分广泛。 数据“燃料”加快共建共享数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今...……更多
...,越来越多的业内人士重新将目光投向驱动模型生成的“燃料”——语料。“大模型就像初生的孩子,教他学习、成长的课本就是AI语料,编纂教材的过程就是构建语料库的过程。”杭州城市大脑有限公司总经理申永生形象比喻...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开...……更多
上海:发力语料,建设“模都”
...、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
...人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。库帕思公司董事长山栋明宣读倡议内容。大会主办方供图建立模型训练、语料供给、学术研究、...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
...专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质...……更多
首个语料库建设导则面世!近二十家企业共同发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。《语料库建设导则》发布。人民网记者 王初摄为实现“语料数据资源共建共享”“鼓励多元主...……更多
...融合都将是公司今年业务增量的发力点,其中积极建设AI模型训练的算料综合服务和交易平台,针对AI模型公司等下游客户销售和运营视频语料业务,是今年公司根据市场变化确定重点发展的方向之一。”4月30日,中广天择董事...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户...……更多
“2024语料风云榜”发布,10家企业上榜!
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。为加速促进大模型语料生态企业按照高标准发现“好产品”、培育“好企业”,本次论坛上,大...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
人民中科董事长张丹:用技术为基层减负 运用人工智能“为民服务”
...发表主题演讲。主办方供图一是主流价值语料库。针对大模型普遍答不了、答不好的重大、敏感、疑难问题,人民网建设了包括基础语料、重点领域语料、敏感问答语料在内的主流价值语料库,目前已完成12万道题的问答语料库...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...工智能与数据服务业务群总裁唐鹏飞。行业数据是AI的“燃料” AI是数据的“大脑”“行业数据和AI之间的关系是相辅相成的。”唐鹏飞表示,AI系统通过对行业数据的学习和分析来发现模式、规律和趋势,这种行业知识驱动的学...……更多
深圳:每年发放最高5亿元“训力券”,降低人工智能模型研发...
...托重大项目资源,以创新方式支持企业低成本使用算力、模型、语料等人工智能服务资源。(责任单位:市发展改革委、市科技创新局、市工业和信息化局)(二)发放“训力券”。每年发放最高5亿元“训力券”,降低人工智...……更多
推动模塑申城语料普惠计划,百万具身智能数据集率先发布
...具身智能为核心方向,构建涵盖语料数据集、行业基座大模型和虚实融合训练场的“数据-模型-训练”技术矩阵,全面推动人工智能高水平集聚发展。在数据集建设上,聚焦复杂任务和真实场景,构建高质量、多样化的数据集,...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。语料运营平台1.0发布。大会主办方供图对照最高标准、最好水平,打造世界一流的语料枢纽,实...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
大模型应用主战场真正热闹起来。上海汽轮机厂的设计师,再不会被一些重复低效环节辜负了才华。工厂一年要设计近150台套机组,30余位设计师的大量精力,曾耗在反复构建配件模型及修改草图上。但近期,工厂迎来一套基于...……更多
...作为神州数码生成式AI战略的核心产品、一站式企业级大模型集成平台,神州问学推出全方位、多层次的平台能力,实现了对计算资源的集成调用、大模型的集成调用、数据/语料治理和知识管理、快速低代码的应用搭建,有效解...……更多
AI赋能游戏:问答机器人的设计与实现
...半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。一...……更多
智驭未来,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0
...网大会乌镇峰会期间,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0,助力政企客户更高质量、更高效率的数字化转型。“焱宇”聚焦高质量语料的精细化梳理和模型轻量化、可移动化,通过高质量数据治理、模型增强调...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
·确定一系列核心方言并为其建立自动语音识别(ASR)模型,当一种未知方言出现时,分析它距离这一系列核心方言中的哪些方言较近,就可以用合适的核心方言ASR模型识别出这种未知方言的内容。·方言应用的窗口期大约是二...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
更多关于科技的资讯:
娇玛仕(北京)生物科技有限公司:让你更加美丽的“秘诀”
美妆和护肤是人们追求美丽和健康的一种方式。好的妆容,不仅是一种变美的方式,更是表达个性和体现审美价值的重要途径。今天做客我们节目的嘉宾
2025-02-05 15:40:00
2024年翻倍了!中国电子纸平板将与Kindle一决高下
快科技2月5日消息,洛图科技(RUNTO)发布的数据显示,中国电子纸平板市场呈现出蓬勃发展的态势。2024年,其出货量高达238
2025-02-05 10:11:00
中华老字号:谢裕大黄山毛峰100g官方9.9元大促
中华老字号谢裕大官方旗舰,谢裕大黄山毛峰100g官方日常售价29.9元买,可领 20元冲量券,实付9.9元包邮。黄山毛峰以杯泡法为宜
2025-02-05 10:12:00
令人唏嘘!苹果新APP又被质疑抄袭啦!
快科技2月5日消息,据媒体报道,近日,知名活动应用及网站 Partiful 的开发者公开对苹果新推出的名为“邀请(Invites)”的全新应用程序
2025-02-05 10:12:00
网红进飞机发动机引擎做俯卧撑引众怒:被网友齐声谴责
快科技2月5日消息,近日一名网红因为爬到飞机引擎中做俯卧撑的视频火了,引发众怒后,他发声为自己辩护。据悉,这名网红23岁
2025-02-05 10:42:00
再创历史新高!经济学家:DeepSeek或对黄金市场影响深远
快科技2月5日消息,据报道,国际金价近期再度攀升至历史新高,伦敦金现报收2841.4美元/盎司,且在近四个交易日内持续刷新纪录
2025-02-05 10:42:00
AMD CPU压倒性胜利!市场份额飙至92% Intel仅剩8%
快科技2月5日消息,根据德国最大零售商Mindfactory的数据,AMD的CPU销量达到了23615块,占总销量的92
2025-02-05 10:42:00
好学生一定就好吗:强烈建议所有人都去培养“差生心态”
从小到大,我们被灌输的理念似乎都是要成为“好学生”,要听话、要努力、要成功……仿佛只有沿着这条看似光明的道路前行,人生才有意义
2025-02-05 10:42:00
女子春节熬夜追剧患上干眼症 医生:重度可致失明
快科技2月5日消息,据报道,28岁的胡女士(化姓)连续几天用手机追剧,因眼睛干涩、畏光、视力下降到医院就诊,被查出患上了干眼症
2025-02-05 11:12:00
最大降雪量竟达到120厘米!日本北海道地区降雪打破全国纪录
快科技2月5日消息,据央视报道,近日,受一股强寒流影响,日本北海道部分地区遭遇强降雪。据日本官方发布的消息,截至当地时间2月4日10时
2025-02-05 11:12:00
开工首日开打价格战!小鹏推出5年0息0首付政策:最高贴息5.7万
快科技2月5日消息,新年开工首日,车企就开打价格战,特斯拉刚刚宣布保险补贴8千元,5年0息购车政策,小鹏汽车也随即跟进
2025-02-05 11:12:00
750℃阻燃+儿童安全门:得力1.8米迷你插排13元大促
天猫得力官方旗舰店,得力1.8 米迷你插排(货号33911)3插位版日常售价22.11元,今日下单立打9折。叠加6元优惠券
2025-02-05 11:12:00
广汽丰田两款SUV官降:仅8.98万起、三大件终身质保
快科技2月5日消息,新一年车圈儿激战正式拉开帷幕,继特斯拉Model 3补贴8000元外加5年0息贷之后,广汽丰田也针对旗下的锋兰达和威兰达两款SUV推出一口价优惠政策
2025-02-05 11:12:00
单支免定制费 墨量可视:得力可定制钢笔+10支墨囊8.9元大促
天猫得力官方旗舰店,得力可定制钢笔(配10支墨囊)日常售价为19.9元,下单领取10元优惠券,首次购买用户叠加1元首购礼金
2025-02-05 11:12:00
AMD Zen1—Zen4架构CPU存在安全漏洞!目前已修复
快科技2月5日消息,AMD的Zen 1至Zen 4架构CPU被发现存在一个关键微码漏洞,该漏洞编号为CVE-2024-56161
2025-02-05 11:42:00