• 我的订阅
  • 头条热搜
AI领域将面临数据墙:高质量语言数据枯竭 可能减缓训练进展
快科技8月1日消息,据媒体报道,目前互联网高质量数据枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。据权威研究公司Epoch AI的前瞻性分析,至2028年,互联网上的所有...……更多
最新美国国家人工智能科学院院士介绍
...kiy的研究推动了图像合成技术的发展,使得机器能够生成高质量、逼真的图像内容。LyleUngar,来自卡内基梅隆大学。他专注于自然语言处理和机器学习在医疗领域的应用。Ungar的工作不仅提高了医疗文本分析的准确性,还为疾病...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...同时提升生成质量。具体来说,Magic3D可以在40分钟内创建高质量3D网格模型,比DreamFusion快2倍,同时实现了更高分辨率,并在人类评估中以61.7%的比率超过DreamFusion。图像-文本模型生成 主要代表作有Flamingo、VisualGPT。Flamingo 是Dee……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...将重点关注最终模型 MMed-Llama 3。研究团队区分了 HQ-Data(高质量数据)和 US-Data(未指定来源数据)。HQ-Data 包括来自书籍和网站的内容,这些内容经过了人工检验,而 US-Data 则是从一般通用语料库中筛选出的与医学相关的内容...……更多
以“价值创造”为导向,医渡科技自研大模型即将发布
...渡科技拥有多年的医疗大数据治理经验,积累了大规模、高质量的可量化知识图谱,使大语言模型能够适应医疗领域的复杂场景,更好地服务于用户需求; 在算法层面,医渡科技组建了以人工智能和医学人才为主的专业大模型团队,...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...面临着一些挑战,并呈现出令人兴奋的未来方向:(1)高质量机器人数据集。获取足够的真实世界机器人数据仍然是一个重大挑战。收集这些数据既耗时又耗费资源。单纯依靠模拟数据会加剧仿真到现实的差距问题。创建多样...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...据集(Unified Time Series Dataset, UTSD)。UTSD覆盖七个领域的高质量时间序列,蕴含时间序列模态的通用“常识”,以此训练模型获得跨领域时序建模的基本能力,例如捕捉主要周期,生成重要模式,以及关注自相关部分等。文章尤...……更多
黄仁勋明天登港!沈向洋3小时重磅演讲:发布多款大模型,具身智能激情碰撞
...了准备工作。另外,无论训练哪种语言的人工智能,底层高质量数据多为英文,人工智能时代英文重要性可能增强。二、发布通用视觉大模型DINO-X,具身智能合作腾讯美团比亚迪 计算机视觉技术在真实世界的应用场景十分广泛...……更多
亮相2024中国图象图形大会,合合信息文档解析技术获行业关注
...ch研究估计,机器学习数据集可能会在2026年前耗尽所有“高质量语言数据”。现阶段,大量的高质量语料数据存在于书籍、论文、研报、企业文档等文档之中,复杂的版面结构制约了大模型的训练语料处理及大模型文档问答的应...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...GenSim 中的任务库是一个内存组件,用于存储之前生成的高质量任务,任务库中存储的任务可用于多任务策略训练或微调 LLM。任务创建器如下图 3 所示,语言链会首先生成任务描述,然后再生成相关的实现。任务描述包括任务名...……更多
2023 的人工智能之年
...下载。Mixtral 8x7B:Mistral AI 还推出了 Mixtral 8x7B,这是一个高质量的稀疏专家混合模型(SMoE),拥有开放权重和总计 46.7B 的参数,代表了在提高真实性和减少偏见方面模型开放性的新阶段。Yi-34B llm:今年估值达到 10 亿美元,李...……更多
...模态大模型进行质量筛选和描述重写,从而自动产生大量高质量的 3D 图像数据,辅助训练更优秀的多视图扩散模型。Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神:BoT 可有效提...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...学家林达华分享了对大模型的思考。他表示,大规模生产高质量数据是大模型研发机构的竞争力所在。当前主流的大模型无一例外都建立在Transformer架构堆叠的基础上,但产业界和学术界在不断探索更加高效的架构,随着验证逐...……更多
百川智能发布baichuan3稳定语言模型
...级别参数模型训练不同,超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级。为更好解决相关问题,百川智能在训练过程中针对性地提出了“动态数据选择”、“重要度保持”以及“异步...……更多
AI翻译界杀手诞生!阿里国际翻译大模型吊打谷歌和GPT-4
...,这与公司在该领域的多年积累密不可分:数十亿规模的高质量电商预料数据,让团队在跨境电商领域一下子就建起了起极为显著的数据优势服务于全球市场的电商平台,让团队对不同国家和地区的文化、语言以及商业法规有了...……更多
AI 已死?不,AIGC 给我们带来了新的希望 | 氪记 2022
...它能够根据所需图像的文本描述,生成符合匹配该描述的高质量图像。它还可以根据一个简单的草图再加上所需图像的文本描述,生成一个看起来更逼真的图像。Meta AI 也发布了名为 Make-A-Scene 的模型,具有类似的图像至图像的...……更多
世界气象组织最新报告:AI 正在革新天气预报,更快、更便宜、更易获得
...显著降低创建支持天气预报所需数据的计算成本以及运行高质量预测模型的门槛。这些能力此前受到计算负担的限制仅可在大型全球预报中心应用,但现如今,没有足够资源的机构也可获得,运行高水平预测模型的进入门槛显著...……更多
...批专精人工智能算法优化的“专家保姆”,要供给海量的高质量“数据食材”。稍有不慎摄入“污染食材”或者对大模型“调教不严”,就极可能培育出“胡说八道”的“熊孩子”,给大模型企业造成难以估量的影响。“考虑未...……更多
东方启音:亮相首届 “一带一路” 国际听力语言大会
...听力语言康复领域的国际合作,助力“一带一路”倡议的高质量发展,2024年10月25日—27日,由北京语言大学和东方启音共同举办的首届“一带一路”国际听力语言大会在京召开。本次大会得到了中华人民共和国教育部、国家语...……更多
腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
...的。其次,是数据方面的挑战。数据是大模型的原料,而高质量的数据目前非常稀缺,目前我国的自动驾驶和汽车行业数据体量是远远不足的。同时,还要考虑数据分类、标注、训练各环节的投入产出比,更要时刻关注敏感数据...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...理,以及在训练过程中的严格数据管理,确保模型能够在高质量的数据上学习,从而提高模型的性能和应用价值。同时,智慧芽围绕数据、算法训练、测试、强化学习构筑了“四位一体”的训练平台。算法上,采用增强式预训练...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个……更多
中国科技创新“乘”数直上
...×科技创新”行动,从推动科学数据有序开放共享、强化高质量科学数据资源建设和场景应用、以科学数据助力前沿研究、以科学数据支撑技术创新、以科学数据支持大模型开发、探索科研新范式等方面阐述了数据要素与科技创...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...论在哪种情况下,关键是要牢记以下几个关键原则来创建高质量的数据集。数据集管理在各种文献的微调实验中,数据集对于获得微调的好处至关重要。除了「更好的质量和更多的示例」之外,还有更多的细微差别,你可以明智...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...ama 3 在真实世界场景中的性能。他们专门开发了一个新的高质量人类评估集,该评估集包含 1800 个提示,涵盖 12 种关键用例(征求建议、头脑风暴、分类、封闭式问题解答、编码、创意写作、提取、角色/人物角色、开放式问题...……更多
...缓解了大模型普遍存在的“幻觉”诟病问题。模型由海量高质量农业知识数据训练而成,数据涵盖农学、园艺学、栽培学、生物信息学、动物科学、动物医学、设施农业等学科,包含超过1000万条农业知识图谱数据及超过5000万条...……更多
小模型正在成为AI界的新宠
...i-3。虽然该模型的参数规模较小,但通过精心设计的训练数据集和优化的算法,超越了同等大小和稍大一号的模型,在各种语言、推理、编码和数学基准测试中表现优异。苹果紧随其后,发布了 OpenELM,包含了 2.7 亿、4.5 亿、11 ...……更多
多国看重“主权人工智能” 竞相研发本地语言产品
...产生类似后果。对于人工智能时代产生的新问题,需要用高质量发展等新观点来追求经济效益与社会效益的统一,才能有效保证和提升全社会、全人类的福祉。在这一过程中,中国由于在人工智能领域展现出较好势头,受到一些...……更多
第二届机器之心AI科技年会成功举办,24位大咖共论AI发展新趋势
...领先的人工智能专业信息服务平台,致力为专业用户传递高质量信息及知识,为相关企业提供专业洞见和决策辅助等服务。AI科技年会是机器之心整合内部所有业务与资源打造的年度盛会,已成功举办两届,未来将继续呈现业内...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...eQA),这是首个全面的中文基准,具有“中文、多样性、高质量、静态、易于评估”五个特性,用于评估语言模型回答简短问题的真实性能力。研究人员表示,中文简短问答能够指导开发者更好地理解其模型的中文真实性能力,...……更多
更多关于科技的资讯:
上海迪拜同发讯飞AI翻译耳机 “中国技术”连接全球
大皖新闻讯 一个是中国对外开放的前沿窗口,一个是中东地区商业中心和“一带一路”重要节点城市,10月14日下午,科大讯飞在上海世界会客厅举行“对话世界
2025-10-15 17:21:00
近日,一批仿冒新闻机构的自媒体账号被依法关闭,据报道,这些账号以“新闻”为名,行“带货”之实。但记者调查发现,此类“李鬼”账号仍在各大平台潜伏
2025-10-15 17:59:00
蛋糕里吃出“牙”,和解填不满食品安全的信任缺口
齐鲁晚报·齐鲁壹点评论员 刘雅菲10月14日,有上海网友发布视频称,自己在上海的山姆会员商店外高桥店购买的枣泥核桃蛋糕中
2025-10-15 16:00:00
三联家电&海信集团强强联手!10.25重磅惠民活动即将启幕
鲁网10月15日讯为抢占四季度消费市场高地,深化品牌战略合作布局,10月11日,山东三联家用电器有限公司与海信集团联合召开“三联家电10
2025-10-15 14:59:00
京东官宣发布新车,称像买手机一样方便,已注册多枚京东汽车商标
10月14日,京东微博账号发文称:2025京东11.11期间,京东联合广汽、宁德时代将正式推出一款神秘国民好车,官方将在10月底将陆续开启内测版
2025-10-15 10:46:00
固安:开足马力赶订单 满足京津冀市场需求
河北新闻网讯(万倩、陈放)10月13日,走进位于固安县固安镇的秋兹科技(固安)有限公司生产车间,自动化裁切设备高速运转
2025-10-15 09:56:00
参展企业334家,展位数再创新高达840个斩获银奖!“南京智造”闪耀广交会南报网讯(记者黄琳燕通讯员宁商轩)第138届广交会将于10月15日在广州开幕
2025-10-15 08:09:00
“云”上调度 雨中守护|雷沃数智化服务为抢收装上智慧大脑
秋收关键期遭遇连绵阴雨,让秋收秋种受阻。除了满足抢收抢烘抢播的智能农机,潍柴雷沃还创新数智化服务,通过智能调度与精准服务
2025-10-15 01:05:00
茶酒融合催生“微醺”新赛道,新茶饮品牌争饮“昼夜”经济
当白天的提神茶饮与夜晚的放松酒品打破边界,正催生出国内消费市场一股新的“微醺”风潮。近期,茶百道经典白酒奶茶回归即创下销量佳绩
2025-10-14 11:33:00
嘎子谢孟伟被执行超1400万,已被限高,此前因穿警服带货被行拘7日
近日,因穿警服直播带货被行政拘留、账号遭封禁的嘎子谢孟伟发视频称 “我回来了”,并向所有观众诚恳道歉。视频中,其透露公司员工已被安排回老家
2025-10-14 11:33:00
平谷将打造全国农业科创中心
原标题:世界农业科创大会开幕 农业中关村核心区2.0发布平谷将打造全国农业科创中心本报讯(记者 赵婷婷)昨天,2025世界农业科技创新大会(WAFI)在北京平谷开幕
2025-10-14 11:59:00
据大象新闻报道,近期蜜雪冰城的小票成了年轻人追捧的“追更凭证”,其上连载着名为《雪王在古代卖咖啡》的小说,20个章节随机印在消费小票上
2025-10-14 12:10:00
电通创意发布《2025首席营销官报告》:算法与人性的重构力量
AI时代,品牌的长期价值回归于人性与文化共鸣,人类的创造力、同理心与文化相关性愈加重要。•AI已成日常:几乎所有CMO都在使用AI
2025-10-14 13:29:00
近日,一则“美团外卖骑手能屏蔽顾客”的消息在网络上引发热议。据媒体报道,美团已在福建晋江、浙江绍兴等七个城市试点上线骑手评价用户和屏蔽用户功能
2025-10-14 13:40:00
这座产业园一年制造千万颗球胆、百万颗整球——沂南县“造球记”
齐鲁晚报·齐鲁壹点 记者 公绪成 李其峰 通讯员 陈婉塑炼、分切、热压......沂南县泽辉体育产业园内,工人们正紧忙制作新一批篮球内胆10月9日
2025-10-14 15:00:00