• 我的订阅
  • 头条热搜
厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?
...通过学习海量的文本来积累知识。思源大模型的预训练的语料达1万亿token,也就是说,它阅读并记住了1万亿字的信息。对于一个普通人而言,一辈子不断阅读,所积累的阅读量也仅有3亿—5亿字。大模型的预训练语料基本覆盖了...……更多
...“吃透”报告,在于其是基于大量准确、专业的两会报道语料数据训练出的一个适用于四川省两会新闻报道的专业大模型。“Chat两会”通过多模态理解、内容生成、智能交互的AI核心能力,提供“智库型”两会热点问答服务。智...……更多
...全国首款多模态交互式情感语言应用模型,在30多个国家语料库的基础上,应用TTS、ASR技术,不仅融合了丰富的语言数据,还整合了基于心理学量表模型库的分类算法,并向新型智能陪伴终端产品提供API引擎接口服务,目前已在...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...存在显著的性能差距,尤其在处理更多样化或异质的训练语料库时,这一差距会进一步扩大。语料库的异质性意味着数据集的多样性,由于内容和风格各异,往往会引入干扰。PEFT 方法对此尤为敏感,在异构情况下性能损失更为...……更多
AI帮我抢到了专家号
...错的病历输出和加号筛选的能力。科室和医生提供的训练语料也不可或缺,比如一线的诊疗场景、更详细复杂的病历,这些语料是互联网公司难以获取的。比如,在加号功能的筛选策略建设上,技术团队在不断精调模型时,武汉...……更多
“AI全家福”集中亮相数贸会 50多个大模型同场竞技
...解,该大模型集合了多种AI美术创作工具,基于原生中文语料数据及平台自有高质量图片数据训练开发,可创作出满足中式审美的国风绘画作品。同时,平台还将根据人机协作数据反馈,让AI创作的作品越来越好。中国造AI大模型...……更多
...施。为了满足大模型发展对高质量、大规模、安全可信的语料数据资源的需求,人民网积极建设“主流价值语料库”,大幅提高大模型的安全性。2. 平台升级推动内容产业发展新质生产力2023年,生成式人工智能全方位赋能内容...……更多
...共性、公益性数据共同空间,构建面向行业的高质量中文语料数据库,推动典型行业数据汇集、访问、共享、处理和使用。基于隐私计算支撑样本数据流通安全,搭建可信数据标注和模型训练环境。鼓励在依法设立的数据交易机...……更多
「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落
...意图的工具存在效率低下的问题。从网络爬取的公开训练语料中,头尾内容的特征存在差异这些语料中有相当高比例的用户生成内容、多模态内容和商业变现内容(俗称带货广告),敏感或露骨内容的比例仅仅略少一些。排名靠...……更多
...细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。在保障支撑方面,《征求意见稿》提出提升数据供给水平。完善数据资源体系,...……更多
支付宝在AI大模型时代
...效训练时长占比达到90%以上。 数据层面,除了全网通用语料与金融领域的优质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模...……更多
...邮储银行、同方知网、蚂蚁数科、欧冶云商、中国大模型语料数据联盟、中国信通院、赛迪研究院、上海国家会计学院、合合信息、金润数科、上海市数商协会等。 ……更多
AI古诗词动画《千秋诗颂》第二辑开播
...真度和动作一致性等多维度的质量提升。同时,新节目在语料训练上首次建立了独具中国审美的模型数据标签体系,节目组使用40万张图片数据和20万分钟的自有版权素材进行标注和预训练,表达出更精准的东方审美韵味,突破...……更多
...发展,该公司的数据许可业务将继续增长。“Reddit的信息语料库对于大型语言模型的训练非常重要,”她说,并补充说,随着人工智能生成的内容变得普遍,该网站19年来有组织和有节制的内容将变得更有价值。 ……更多
标贝科技亮相全国人机语音通讯学术会议NCMMSC2023并发表主题演讲
...平台》的主题报告,和与会嘉宾分享的数据标注能力以及语料库建设成果。作为全国知名语音盛会,NCMMSC是国内语音领域广大专家、学者和科研工作者交流研究成果,促进该领域研究和开发工作不断进步的重要舞台,至今已成功召开...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...型从设计上就更像文科生而不是理科生。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。8个大模型答错大模型这一算术问题最开始被艾伦研究机构(Allen Institute)成员林禹臣发现,他在X平台上发布的截图显示,Ch...……更多
生成式AI时代的业务流程管理变革,BPM迎来大型流程模型
...计的工具,它重用了大量通常策划不佳的人工生成文本的语料库,因此很多行为是不可预测的,输出的结果经常不符合逻辑,以至无法使用。这种情况,限制了LLM在很多商业环境中的适用性。从结构上讲,流程模型是逻辑语句,...……更多
3500P算力就位!北京数据基础制度先行区扩至海淀
...挥智源前沿研究优势,凝聚行业力量,建设高质量大模型语料库,构建开源开放平台,推动通用人工智能技术及产业取得重大突破进行介绍。北京海天瑞声科技股份有限公司董事长贺琳表示将推动人工智能数据服务创新,积极参...……更多
“混元”迭代,大模型App腾讯元宝正式上线
...腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7 万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense 版本提升超50%。除不断提升通用大模型能力外,腾讯混元也支持角色扮演、FunctionCa...……更多
360税务行业标准大模型入选人民网数造新实体典型案例
...税集团30多年涉税服务领域专业知识,搭建起完善的训练语料库,涵盖超百万法规、千万案例判例、万余本税务电子书以及百亿税务行业汉字集。据测试,税务行业标准大模型在注册税务师考试中的成绩已经超越了ChatGPT,获得业...……更多
...意识形态安全问题,提议“以模制模”,就是用高质量的语料训练一个专有的垂直的小的模型,对业务大模型进行实时动态管理和管控。据介绍,“数据安全”交流活动的举办,旨在搭建高端对话平台,汇聚行业精英的智慧与力...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...混元大模型,据了解该模型拥有超千亿参数规模,预训练语料超过2万亿Tokens,并已接入腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等50多个腾讯业务。而且在国家公布的首批大模型厂商中,腾讯混元大模...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...模型,在预训练模型的基础上,使用额外的大规模未标注语料库继续训练模型参数,这个过程可以进一步丰富模型对语言的理解和生成能力,使其获得更广泛的知识。根据JohnSchulman的说法,后训练是GPT-4模型不断升级的关键因素...……更多
《历史铸就统一体》等中国自主的知识体系成果发布
...中国外语教育研究中心研究员刘鼎甲发布《中国英汉平行语料库研究》著作成果。该书是国家社科基金重大项目“大规模英汉平行语料库的建立与加工”的重要成果,荣获第九届高等学校科学研究优秀成果奖一等奖。“中国英汉...……更多
...炳军介绍,通过建立的场景数据集回流机制,定期将场景语料汇聚到专业、行业数据集,逐步提高了大模型能力。业内人士表示,大模型作为一种先进的数据分析工具,通过处理和分析海量数据,能够帮助用户从复杂的数据中提...……更多
大语言模型如何宣告心理学的死亡?
...的是月亮本身,而不是指向它的手指。同样,LLM训练用的语料库就像是指向更深层次知识的手指,研究者的目标是了解LLM是否能够把握那些更为深远的含义,即“月亮”。对于人类来说,理解和应对现实世界的任务涉及到他们心...……更多
...现场“2024年度⼗⼤⽹络⽤语”是基于国家语言资源监测语料库中的网络媒体部分,采⽤“智能信息处理技术结合领域专家意见及相关站点收录情况”的⽅式获得的。监测语料库涵盖了视频弹幕、⽹络新闻等多种媒体形式的语言...……更多
华为星河AI自动驾驶两大杀手锏公布:实现L4级高阶自智
...ter基于华为盘古大模型训练而成,融合华为500亿数据通信语料与1万名专家经验,具备智慧助手Copilot和多个场景化Agent能力。华为表示,未来将推出更加领先、智能的网络解决方案,助力全球客户全面迈向L4自智网络。【本文结束...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那如果我们能喂给它足够数量的形式证明数据,定理证明能力自然水到渠成?然而,我们看到的事实是,无论用符号形式还是自然语言,GPT等大模型的...……更多
...厂商将投入巨额资金购买底层数据库,这些数据库涵盖了语料、图片、音视频等多种类型的数据。如果客户在使用这些数据库生成的内容时,其著作权归属于客户,这将对厂商的利益产生不利影响。未来,更应当面向产业链,关...……更多
更多关于科技的资讯:
鲁网11月19日讯近日,由建行日照分行青年员工朱杰主导研发的“机箱及计算机主机及支架装置及具有其的显示器”两项实用新型专利
2025-11-19 11:14:00
圆满收官!2025年第二届中关村具身智能机器人应用大赛落幕
中国网讯 11月17-18日,在北京中关村国家自主创新示范区展示中心,以“具身引智、应用未来”为主题的2025年第二届中关村具身智能机器人应用大赛圆满收官
2025-11-19 11:24:00
“箱包之都”牵手中国大集,共筑数字信任新生态
鲁网11月19日讯 (记者 吴艳萍)在数字经济与实体经济深度融合的背景下,11月18日,中国大集与白沟箱包产业带W2W战略合作签约仪式举行
2025-11-19 11:52:00
大华股份亮相中国国际电力设备及技术展览会
11月18日,第三十二届中国国际电力设备及技术展览会在上海新国际博览中心盛大启幕。大华股份携子公司华感科技、华消科技重磅参展
2025-11-19 13:58:00
2025咪咕生态大会启幕,“微短剧 +” 跨界融合共筑内容新生态
11月18日,以“焕彩同行,价值共生”为主题的2025咪咕生态大会在京举行。现场,咪咕数字传媒有限公司携手合作伙伴,聚焦微短剧生态发展
2025-11-19 08:26:00
奋进的河北·“十四五”答卷丨身边的“十四五”(三):生产线上的产学研
整理/河北日报记者 王璐丹 制图/孙 涛从破解脑蛋白药物的“黑匣子”,到打破氢能隔膜的进口依赖,再到让机器人在高空“举重若轻”……近年来
2025-11-19 08:30:00
厦门网讯(厦门日报记者 应洁)美妆等零售新业态增长迅速、打造集美咖啡季品牌、持续开展“集美欢乐购”促消费活动……昨日,集美区相关领导接听市12345政务热线
2025-11-19 08:46:00
近日,阿里巴巴正式宣布启动“千问”项目,同时,千问APP公测版上线。千问APP公测版凭借免费以及与各类生活场景生态的结合
2025-11-19 09:39:00
社交平台如何兼顾用户的理性与感性需求?米连科技给出答案
在当代婚恋市场,一个明显的趋势正在形成:年轻人越来越追求“理性择偶”,而经历过人生起伏的中年人则更看重“情感共鸣”。这两种看似不同的需求
2025-11-19 10:27:00
“深海一号” 首次搭载青岛联通船载5G专网融合通信系统 系统创新性可靠性在深远海极区场景得到全面验证
鲁网11月19日讯近期,青岛联通船载5G专网融合通信系统首次搭载于“深海一号”科考船赴深海大洋极区,“大流量、低时延、超稳定”的卓越性能在低温
2025-11-19 09:29:00
11月17日从中北高新区获悉,山西中北测控科技有限公司自主研制生产的加装测量存储系统圆满完成航空航天领域使用场景验证,各项性能指标均达到行业领先水平
2025-11-18 08:20:00
烟台工程职业技术学院成功入选国家级“IITC工信人才AI实训云平台”首批应用院校
鲁网11月18日讯近日,工业和信息化部人才交流中心公布了“IITC工信人才AI实训云平台”首批应用院校名单,烟台工程职业技术学院凭借在数字化基础设施与产教融合方面的深厚积淀
2025-11-18 15:49:00
OPPO Reno15 系列正式发布,潮流实况玩法“超出圈”
2025年11月17日,成都——OPPO正式发布全新一代Reno15系列手机。作为潮流与实况照片引领者,Reno15系列行业首发全息光刻工艺
2025-11-18 15:54:00
中国工程院院士邬贺铨、郑纬民点赞阿里千问APP:坚持走专业严谨的路线 期待中国AI走向世界舞台中心
11月18日消息,阿里巴巴千问APP近日开启公测,接入全球性能第一的开源模型Qwen3并免费开放。两位中国工程院院士就此分别接受了媒体采访
2025-11-18 16:57:00