• 我的订阅
  • 头条热搜
AI数据之战:大模型的“燃料”还能烧多久?
...版社之一西蒙与舒斯特公司。但作为人工智能大模型的“燃料”,高质量语料正在面临“枯竭”。加州大学伯克利分校计算机科学教授斯图尔特・罗素就曾发出警告,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...大模型视为正在疾驰的科技列车,数据语料便是珍贵的“燃料”。其中,语料质量的提升对模型性能取得阶段性突破至关重要。然而一个现实情况是,高质量语料正在被急速消耗。国内大模型厂商所面临的语料短缺问题十分严峻...……更多
千行百业加速拥抱大模型(AI前沿观察)
...技术与实体经济加速融合,应用场景十分广泛。 数据“燃料”加快共建共享数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今...……更多
...,越来越多的业内人士重新将目光投向驱动模型生成的“燃料”——语料。“大模型就像初生的孩子,教他学习、成长的课本就是AI语料,编纂教材的过程就是构建语料库的过程。”杭州城市大脑有限公司总经理申永生形象比喻...……更多
大模型驱动行业创新 媒体机构探索AI数据要素开发
...人机共存消费模式”。“语料数据是大模型训练的重要‘燃料’,有助于大模型更好地适配实际的应用场景,实现人工智能赋能千行百业的愿景。”王巍表示,从目前的情况来看,虽然我国的数据资源丰富,但是由于数据挖掘不...……更多
星环科技成功举办数据要素市场与大模型语料库论坛
...坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息科技(上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开...……更多
上海:发力语料,建设“模都”
...、人民网、国家气象中心等单位联合发起的中国第一个大模型语料数据联盟正式成立。2023年7月6日,大模型语料数据联盟成立。人民网记者 王初摄人工智能大模型取决于三大要素:算力、算法、语料。算力是硬件,算法是大模...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
...人工智能大模型训练数据集,为人工智能大模型厂商提供燃料。“这次中文在线在贵数所上线的数据集产品包括了中文在线数字图书馆数据集、有声音频书数据集、中小学题库数据集、高校职教题库数据集、视频资料数据集等。...……更多
50余家单位共同发起“语料生态服务大模型可持续发展倡议”
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。库帕思公司董事长山栋明宣读倡议内容。大会主办方供图建立模型训练、语料供给、学术研究、...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...平台,旨在构建一个多样化的指令微调数据集,以提升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分...……更多
...专业委员会20日在北京召开发布会,面向社会发布用于大模型的首批中文基础语料库。据悉,网安协会人工智能安全治理专委会会同国家权威机构,发挥企业、高校和科研单位协同优势,通过“共建-共享”机制,汇聚一批高质...……更多
首个语料库建设导则面世!近二十家企业共同发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。《语料库建设导则》发布。人民网记者 王初摄为实现“语料数据资源共建共享”“鼓励多元主...……更多
...融合都将是公司今年业务增量的发力点,其中积极建设AI模型训练的算料综合服务和交易平台,针对AI模型公司等下游客户销售和运营视频语料业务,是今年公司根据市场变化确定重点发展的方向之一。”4月30日,中广天择董事...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...何看待知乎当下和未来,有三个基本的视角:它是大语言模型预训练中文语料最重要来源之一,例如最近现象级的大模型聊天应用 Kimi Chat,就以知乎为重要的训练资料来源(甚至是 80% 以上的来源)。每一个在知乎上提问的用户...……更多
“2024语料风云榜”发布,10家企业上榜!
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。为加速促进大模型语料生态企业按照高标准发现“好产品”、培育“好企业”,本次论坛上,大...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
人民中科董事长张丹:用技术为基层减负 运用人工智能“为民服务”
...发表主题演讲。主办方供图一是主流价值语料库。针对大模型普遍答不了、答不好的重大、敏感、疑难问题,人民网建设了包括基础语料、重点领域语料、敏感问答语料在内的主流价值语料库,目前已完成12万道题的问答语料库...……更多
“AI是我们的好朋友!” 南威软件构建“数据+AI”新引擎
...工智能与数据服务业务群总裁唐鹏飞。行业数据是AI的“燃料” AI是数据的“大脑”“行业数据和AI之间的关系是相辅相成的。”唐鹏飞表示,AI系统通过对行业数据的学习和分析来发现模式、规律和趋势,这种行业知识驱动的学...……更多
语料运营平台1.0在沪上线,首批十大高质量语料产品发布
...时代”为主题,围绕高质量语料数据如何高效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性的语料生态设计理念。语料运营平台1.0发布。大会主办方供图对照最高标准、最好水平,打造世界一流的语料枢纽,实...……更多
容易“幻觉”的大模型与最严肃制造竟双向奔赴了?造船、高端装备已着迷……
大模型应用主战场真正热闹起来。上海汽轮机厂的设计师,再不会被一些重复低效环节辜负了才华。工厂一年要设计近150台套机组,30余位设计师的大量精力,曾耗在反复构建配件模型及修改草图上。但近期,工厂迎来一套基于...……更多
AI赋能游戏:问答机器人的设计与实现
...半年前,我们也在游戏内嵌社区中,上线了一款以大语言模型为核心打造的问答机器人,旨在满足玩家快速获取攻略的需求。这篇文章,将以游戏行业产品经理的角度,分享这款问答机器人的实现原理,及其语料的制作经验。一...……更多
...作为神州数码生成式AI战略的核心产品、一站式企业级大模型集成平台,神州问学推出全方位、多层次的平台能力,实现了对计算资源的集成调用、大模型的集成调用、数据/语料治理和知识管理、快速低代码的应用搭建,有效解...……更多
智驭未来,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0
...网大会乌镇峰会期间,浪潮科技重磅推出“焱宇”行业大模型服务平台V1.0,助力政企客户更高质量、更高效率的数字化转型。“焱宇”聚焦高质量语料的精细化梳理和模型轻量化、可移动化,通过高质量数据治理、模型增强调...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...多场论坛、百余项成果,集中展示了生成式人工智能、大模型、机器学习、类脑计算等多个图像图形领域的进展。大模型技术正随着科技革新实现广泛应用,满足多行业图像处理需求。大会期间,由CSIG文档图像分析与识别专委...……更多
b站开源轻量级index-1.9b系列模型,包含多个版本
6月20日消息,B站昨日开源了轻量级Index-1.9B系列模型,包含基座模型、对照组、对话模型、角色扮演模型等多个版本。附官方简介:Index-1.9Bbase:基座模型,具有19亿非词嵌入参数量,在2.8T中英文为主的语料上预训练,多个评测...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
·确定一系列核心方言并为其建立自动语音识别(ASR)模型,当一种未知方言出现时,分析它距离这一系列核心方言中的哪些方言较近,就可以用合适的核心方言ASR模型识别出这种未知方言的内容。·方言应用的窗口期大约是二...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
江苏大模型行业应用对接会举行 科大讯飞等落子南京玄武
...自:人民网-江苏频道活动现场。玄轩摄8月30日,江苏大模型行业应用对接会在南京市玄武区举行,现场发布了大模型行业十大应用场景,科大讯飞、浪潮云等龙头企业落子玄武,一批大模型企业与场景企业签约。人工智能大模...……更多
香港首个基础大模型与凤凰卫视旗下机构达成战略合作
...及多元文化的高质量语料数据集,并探索合成数据加速大模型迭代的新模式,共同推动香港生成式人工智能的行业发展,加强华语文化对生成式人工智能领域的影响。签约仪式现场。受访方供图业内认为,凤凰智媒和香港生成式...……更多
更多关于科技的资讯:
首座3000米以上隧道!雄忻高铁山西段紫罗山1号隧道顺利贯通
快科技3月5日消息,据报道,历经731个日夜的奋战,雄忻高铁(山西段)紫罗山1号隧道顺利贯通。这是雄忻高铁贯通的首座3000米以上隧道
2025-03-05 15:12:00
5G智能引领 海信中央空调用心做产品
海信中央空调以实力品质成为行业标杆。海信中央空调的实力技术,是其品质保障的核心所在。在技术研发方面,海信始终保持着前瞻性的视野
2025-03-05 15:14:00
购买SU7 Ultra是否有购置税?小米:有3万补贴
3月4日,小米汽车官方微博发布“小米汽车答网友问(第115集)”,其中回应了不少车主提到的“购买SU7 Ultra是否有购置税”的问题
2025-03-05 15:26:00
浙商基金任命楼羿南为督察长 原督察长纪士鹏离任
中国经济网北京3月5日讯今日,浙商基金公告,任命楼羿南为督察长,原督察长纪士鹏离任。公告显示,楼羿南2011年8月加入浙商基金管理有限公司
2025-03-05 15:39:00
云稼“芝麻生活折扣店”亮相第四届中国零售供应链展览会!
云稼芝麻生活折扣店亮相第四届中国零售供应链展览会:乡村零售新风口,供需资源齐交融2025年3月2日,第四届中国零售供应链展览会在郑州国际会展中心顺利举办
2025-03-05 15:40:00
近日,“AI公务员”上岗的话题引发大量关注。据报道,深圳市福田区推出基于DeepSeek开发的“AI数智员工”,已上线11大类70名“数智员工”
2025-03-05 15:41:00
一张书桌、一盏台灯、一台电脑,这是文字工作者熟悉的创作场景。在这样的场景中,灵感的火花需在长时间的冥思苦想、资料查阅中艰难迸发
2025-03-05 15:41:00
瞬息互娱创始人辟谣:与鸿蒙智行遭遇的黑公关无关
快科技3月5日消息,日前,瞬息互娱创始人“玩机少女”微博辟谣,称瞬息互娱MCN从未参与任何黑公关行为。玩机少女表示,“首先
2025-03-05 15:42:00
惊骇!美国一公司宣布培育出“猛犸象特征”的老鼠
快科技3月5日消息,据媒体报道,当地时间3月4日,美国初创生物企业“巨无霸生物科学”公司宣布,他们已经在实验室培育出具有“猛犸象特征”的老鼠
2025-03-05 15:42:00
小孩哥喊话雷军出一款全家出行的车:他们说只要给你需求 你就能满足
快科技3月5日消息,一名小男孩在短视频平台上替自己的米粉妈妈喊话雷军,亲爱的小米雷总叔叔,我们很想成为你品牌新车的第一批车主
2025-03-05 15:42:00
华网·两会世界窗|波士顿科学:政策创新与本土化共振,看中国医疗产业升级新机遇
文|罗曾2025年3月4日,随着全国两会进程推进,如何通过制度创新吸引全球资源、激发本土创新活力,成为中国医疗产业高质量发展的关注方向之一
2025-03-05 15:45:00
智汇金陵 共探AI未来:开发者圈层沙龙·南京站圆满举行
近日,南京市鼓楼区发改委(工信局)、百度飞桨(南京)人工智能产业赋能中心、百度飞桨星河社区联合举办的“大模型深度应用与产业融合”开发者圈层沙龙在南京华贸中心成功举办
2025-03-05 15:46:00
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
北京大学王选计算机研究所研究员、博士生导师 赵东岩出品|搜狐科技作者|张雅婷随着DeepSeek的爆火,公众对AI幻觉的担忧也日益加剧
2025-03-05 15:54:00
扔掉手机跑步!览邦Watch Ultra:视频通话+徒步+畅玩游戏,运动党狂喜
对于热爱运动的人来说,手机往往是跑步、徒步时的“甜蜜负担”。想听歌、想记录运动数据、想接电话,都离不开它,但带着又嫌累赘
2025-03-05 15:56:00
家居跨境电商下半场:暗壳AI打通全域营销“堵点”!
内销市场内卷加剧,跨境出海风潮涌动。“AI+跨境电商”架构深度赋能中国家居产业,为其加速扬帆海外市场提供新的可能性。近日
2025-03-05 15:59:00