• 我的订阅
  • 头条热搜
广东:着力构建高质量多模态中文数据集 【广东:着力构建高质量多模态中文数据集】财联社11月13日电,广东省人民政府发布关于加快建设通用人工智能产业创新引领地的实施意见。其中提到,深入实施广东第二轮公共数据资...……更多
...。 今年3月,广东省九部门印发的《广东省算力基础设施高质量发展行动暨“粤算”行动计划(2024—2025年)》提出,全省推进“1+2+N”算力中心布局,以韶关数据中心集群为核心,形成广州、深圳两个低时延智能算力应用区,N...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...媒体和论坛取材,经过严格筛选和细致处理,构建了一份高质量中文指令微调数据集“COIG-CQIA”,用于AI训练。论文称,这份数据集中的数据来源于知乎、小红书、豆瓣、弱智吧等社交平台,旨在构建一个多样化的指令微调数据...……更多
...寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集,由37家不同的数据商提供,涵盖12个“数据要素×”领域,3家境外数据商,7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。且本批数据...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗...……更多
...个数据要素登记行业节点DOID为载体,上线572个人工智能高质量训练数据集,首创数据要素行业稀有地图,为人工智能大模型发展精准赋能。本次上线的数据集汇聚了丰富数据资源,首批高质量人工智能大模型训练数据集供给方...……更多
...集的数据集将开源开放,用户可以免费下载;有意向互换高质量数据集的主体,可以参与构建数据池,合作共建、共享数据集;高价值数据集则通过数算一体模式,确保模型在加工、训练过程中,数据不出安全域,保障数据安全...……更多
...易所携手19家数商生态企业和机构共同发布633个人工智能高质量训练数据集。这些训练数据来自贵州勘设、贵州新气象、中文在线、中财数碳、晴数智慧、中国知网、中科富创等19家企业和机构,覆盖“数据要素×”交通运输、金...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...足多样化的语音合成需求。此外,方言语料库的稀缺以及高质量标注数据的匮乏,也进一步增加了技术难度。 巨人网络 AI Lab 的技术创新与突破为了解决上述难题,巨人网络 AI Lab 团队中的算法专家和语言学家共同努力,基于中...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...业和信息化部等七部门印发《关于加快推进视听电子产业高质量发展的指导意见》。其中提出,支持彩电龙头企业丰富产品矩阵,完善产业链条,开拓海外市场,持续提升生态主导力,引领行业发展。鼓励音箱、耳机、麦克风代...……更多
国产中文大语言模型“天河天元”发布
...务智能混合计算,打造全方位的算力赋能创新和数字经济高质量发展载体。未来,国家超算天津中心还将在“天河天元大模型”的基础上启动深度训练面向医疗、工业、法律等领域的专业模型。未来大模型将在深度学习平台的支...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用户提出的文本创作需求,利用扩散模型生成算法,生成高质量、自然的写实图像。例如借助“书生2.5”的以文生图能力帮助自动驾驶技术研发,通过生成各类真实的道路交通场景,如繁忙的城市街道、雨天拥挤的车道、马路上...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...拥有内容数据的平台型企业追随。Google产品线积累的海量高质量多模态数据, 是后续Gemini的快速、持续迭代的保障。Gemini的技术报告中也有这样一段表述,“谷歌发现数据质量对于高性能模型至关重要,并认为在寻找预训练的...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...天工」Skywork-13B系列,并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,它们在CEVAL, GSM8K等多个……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...」在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。这也是“天工”让用户感受到其足够“聪明”、“通人性”的关键原因之一。开源社区科学家助力 打造更懂中文的对话式AI产品“天工”在开发过程中也得到...……更多
...趋势,即:多模态预训练大模型是人工智能产业的标配;高质量数据愈发稀缺将倒逼数据智能飞跃;智能算力无处不在的计算新范式加速实现;人工智能生成内容应用向全场景渗透;人工智能驱动科学研究从单点突破加速迈向平...……更多
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...累,并在人工智能发展和应用过程中,通过搜索等积累了高质量的数据,包括百度智能云在服务客户过程中,也积累了很多行业数据。业内观点认为,随着文心一言开放测试,真实的人类反馈能够促进大语言模型飞速迭代。据介...……更多
GPT-4撞上文心一言,百度压力骤增:多模态和中文能力受关注,或多种方式落地
...”文心一言发布前夕,OpenAI抢先发布了功能更为强大的多模态大模型GPT-4,巨大的压力给到了百度。前后脚发布,高调宣传的百度难免会被拿来对比,或将面临发布即落后的尴尬。毫不夸张地讲,如果明日发布的文心一言达不到...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新,具体可参见技术报告。腾讯混元3D生成大模型则是业界首个同...……更多
千行百业加速拥抱大模型(AI前沿观察)
...”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。今年7月,2023世界人工智能大会发起成立了中国大模型语料数据联盟。8月,上海人工智能实验室宣布,联合...……更多
标贝科技亮相全国人机语音通讯学术会议NCMMSC2023并发表主题演讲
...项目经验。通过自研的一站式AI数据平台,长期为企业提供高质量AI数据解决方案。同时依托于数据大模型高自动化、高精度、高效率优势,具有智能化多领域数据标注处理能力,支持对音频、文本、图像和点云等多模态数据的自动...……更多
...底,努力做到数据可控、框架可控、模型可控。加快建设高质量中文数据资源库。要在不断完善国家数据基础制度基础上,推动典型行业数据汇集、访问、共享、处理和使用,着力盘活数据资源存量;加强数据标准体系建设,提...……更多
...。首先是数据问题。测评结果的准确性和可信度,依赖于高质量、多样化的数据集。然而,数据孤岛和数据泄露问题限制了评测的深度和广度。此外,缺乏统一的评测标准,也让不同机构的评测结果缺乏可比性。林咏华在谈及这...……更多
AI大模型赋能交通:化身“数字运维专家”,融入车管电子书
...千行百业的若干措施》印发,提出促进广东人工智能产业高质量发展,加速形成新质生产力,构建现代化产业体系,赋能千行百业提质增效,创造智能时代的经济新模式、生活新体验、治理新方式。提及人工智能带来的生产方式...……更多
vivo X100系列首发蓝心大模型:在多个榜单中排名第一
...谱研究院以来,已经积累了13000T的多种模态数据以及2800T高质量中文文本数据。工程师不断从多维度入手持续丰富训练数据,强化算法,同时通过信息技术应用创新去解决算力问题并不断提升技术安全能力。黄韬表示,vivo致力于...……更多
ChatGPT席卷全球,内容产业最先被革命?
...数据、预训练模型、商业化产品。数据是后两者的源头,高质量的训练数据决定了AIGC的质量,以及,未来是否能通过用户买单的商业化产品,让人工智能成为可持续发展的技术路线。在他看来,AI训练的核心资源是数据,AIGC想...……更多
更多关于财经的资讯:
香港零售管理协会指恢复深圳一签多行能为港带来人流
观点网 香港报道:2月4日,香港零售管理协会主席谢邱安仪表示,香港去年全年零售业总销货价值较2023年全年下跌7.3%
2025-02-04 20:30:00
科德数控:收到国家项目补助、智造强省项目补助共计6909.00万元
科德数控2月4日公告披露,公司于近日收到三笔国家项目补助资金共计人民币5693.00万元及三笔智造强省项目补助资金共计人民币1216
2025-02-04 20:30:00
长城汽车1月销量8.09万台,同比下降22.2%
财中社2月4日电 长城汽车(601633/02333/82333)发布公告,披露了2025年1月的产销量情况。具体数据见下表
2025-02-04 20:32:00
沈阳化工预计2025年日常关联交易金额增至28.74亿元
财中社2月4日电 沈阳化工(000698)发布公告,预计2025年度与关联方的日常关联交易总额为28.74亿元,较2024年增加23
2025-02-04 20:32:00
渣打集团回购股份56万股 回购金额596万英镑
财中社2月4日电 渣打集团(02888)发布公告,2025年1月29日,公司在伦敦证券交易所回购股份39万股,回购价格为10
2025-02-04 20:32:00
华天酒店与控股股东全资子公司签署股权托管协议
财中社2月4日电 华天酒店(000428)发布公告,公司与控股股东湖南旅游发展投资集团有限公司的全资子公司湖南阳光资产经营管理集团有限公司签署了《股权托管协议》
2025-02-04 20:32:00
丽珠集团回购27万股A股 支付金额1000万元
财中社2月4日电 丽珠集团(000513/01513)发布公告,截至2025年1月27日,公司已购回27万股A股,购回价格区间为36
2025-02-04 20:32:00
财信发展控股股东部分股份将司法拍卖
财中社2月4日电 财信发展(000838)发布公告,控股股东重庆财信房地产开发集团有限公司(以下简称“公司”)的部分股票将被司法拍卖
2025-02-04 20:32:00
江铃汽车1月轻型客车销量为5088辆 同比增长23.65%
财中社2月4日电 江铃汽车(000550/200550)发布公告,2025年1月的产销快讯数据显示,公司的轻型客车在本月的产量为5561辆
2025-02-04 20:33:00
每日互动:公司未持有深度求索和幻方科技股权,也尚未向DeepSeek提供语料数据
每日互动2月4日晚间发布股票交易异常波动公告,近期,公司关注到部分媒体将我司股票认为是“DeepSeek 概念股”,并引起资本市场的强烈关注
2025-02-04 20:33:00
港股三大指数高开高走:恒生指数涨2.83%,恒生科技指数涨5.06%
2月4日,港股三大指数高开高走,盘中虽有所回落,但尾盘延续强劲升势。香港恒生指数收盘涨2.83%报20789.96点,恒生科技指数涨5
2025-02-04 20:33:00
朔州一煤业公司有新动态!
山西朔州平鲁区国兴煤业有限公司增加开采4号煤层项目联合试运转信息公告《山西朔州平鲁区国兴煤业有限公司增加开采4号煤层项目联合试运转方案》已经中煤集团山西华昱能源有限公司审查同意
2025-02-04 20:34:00
泰达股份调整参股子公司北方信托会计核算方法
财中社2月4日电 泰达股份(000652)发布公告,公司对其参股子公司北方国际信托股份有限公司的会计核算方法进行了变更
2025-02-04 20:35:00
北部湾港控股股东累计增持44万股 计划继续增持
财中社2月4日电 北部湾港(000582)发布公告,控股股东广西北部湾国际港务集团在增持计划实施期限已过半的情况下,累计增持公司股份44万股
2025-02-04 20:35:00
北川:新春企业开工忙 “热辣滚烫”奋战“开门红”
新年新气象,企业开工忙。2月3日,农历正月初六,北川各企业在浓浓的年味中相继开工。各企业忙着赶订单,忙生产,争主动,全力以赴
2025-02-04 20:35:00