训练,效果,数据,研究,国际,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...一篇计算机科学论文指出，用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出，这个概念称为“模型崩溃”。该研究显示，原始内容会在AI数代内变成不相关的胡言乱语，显示出使用可靠数据训练AI模...……更多

2024-07-27 13:11:00训练,效果,数据,研究,国际,模型

中国电信进一步开源12B星辰大模型

...解除Word Embedding与lmhead共享参数，有效提升模型稳定性和训练效果，并基于精细化的CheckPoint效果验证，进行动态的数据配比优化调整，大幅提升模型训练效果。海量高质量数据是保证大模型效果的基础，TeleChat-12B将7B版本1.5T训练...……更多

2024-04-28 11:38:00进一,中国电信,中国,星辰,模型,电信

让人工智能模型训练提速10倍以上

本文转自：中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯（通讯员高雨桐记者陈彬）南开大学、南开国际先进研究院（深圳福田）教授程明明团队发布了一项国际联合研究成果MDT，与人工智能文字生成视频大...……更多

2024-04-03 07:20:00人工智能,提速,人工,模型,训练,智能

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...机系获得博士学位，在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说，2023年是国内大语言模型狂飙的元年...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...Skywork-13B的基础模型，其经由3.2万亿个多语言高质量数据训练，在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。 Skywork-13B-Math模型经过专门的数学能力强化训练，在GSM8K等数据集上取得了同等规模模...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

圆桌｜生成式AI时代，大模型数据安全如何保障？

...主任黄民烈如是说道。他认为，生成式人工智能可以通过训练去组合，去生成新的内容，这些内容可能在过去的语料里根本没出现过，但它依然是有害的。所以，即便把训练数据处理得很干净，在生成式人工智能时代依然会面临...……更多

2024-04-27 00:22:00圆桌,生成,模型,保障,时代,安全

AI翻译界杀手诞生！阿里国际翻译大模型吊打谷歌和GPT-4

...然是一个复杂领域。基于深度学习的机器翻译，虽然对于训练过的文本语料可以游刃有余，但对于和训练文本差异过大的文本，翻译能力就会大幅下降。除了训练数据的局限性之外，AI的上下文理解有限、也让不同语种的语言结...……更多

2024-10-17 09:49:00阿里,模型,杀手,国际,电商,模型

清华大学金融科技研究院副院长魏晨阳：大模型以超级助理的形式，

...会限制大模型的应用效果和准确性。隐私方面，大模型的训练和应用过程中可能涉及用户的隐私信息及企业的敏感数据，需要采取措施保护用户隐私和企业数据安全。算力则是大模型训练的另一个刚需。对于应对措施及建议，魏...……更多

2023-12-08 17:24:00清华大学,晨阳,清华,百业,院长,研究院

清华提出时间序列大模型：面向通用时序分析的生成式Transf

...研究团队基于Transformer在大规模时间序列上进行生成式预训练，获得了任务通用的时序分析模型，展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角，对于理解复杂系统、预测未来变化和制定决策规划...……更多

2024-07-22 09:44:00时间序列,时序,清华,序列,生成,模型

硅谷手记｜AI抄袭背后的硅谷“不光彩文化”

...研究团队发布名为Llama3-V的大模型，声称只要500美元的预训练成本，就能用它获得比肩GPT-4V等著名大模型的效果。这一消息在社交媒体和人工智能学术界被广泛转发。但业内人士很快发现，该大模型涉嫌抄袭清华大学等机构发...……更多

2024-06-05 13:55:00硅谷,光彩,手记,抄袭,背后,文化

港中文团队提出大模型元推理范式，革新大模型的评价体系

...种全新评测范式对于当前数据污染的鲁棒性。此前，由于训练数据的不透明，人们无法得知大模型在一些榜单上的成绩提升，是否是数据污染和题目泄露所带来的。而本次提出的全新评测范式，对于“背题”式的成绩提高有着极...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...发团队还发布了Time-300B数据集，为时序分析提供了丰富的训练资源，为各行各业的时间序列预测任务带来了新的解决方案。在当今以数据为驱动的时代，时序预测已成为众多领域不可或缺的核心组成。然而，构建一个兼具强大性...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

清华教授唐杰：Scaling Laws虽被质疑，但至今仍是提

...2/GPT-3、T5等基于大规模无标注数据自监督学习的大规模预训练算法。这些算法模型均在大数据支持下拥有较大规模模型参数，具备较强的通用能力，可完成多场景任务，显著降低学习成本、提高学习效率。2020至2022年，迎来了模...……更多

2024-06-05 18:36:00清华,模型,教授,性能,方法,模型

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作主要集中在单次或批量编辑上，由于灾难性的知识遗忘和模型性能的下降，这些方法在终身编...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

...效果。通过广泛的实验评估，RecDiff在提高推荐准确性、训练效率以及去噪效果方面均表现出色。研究方法基于图协同过滤的编码器受到简化图神经网络（GNN）成功应用的启发，图那对在社交去噪框架中采用了轻量级图卷积网络...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

苹果开源7B模型，训练过程数据集一口气全给了，网友：很不像苹

...7B模型，不仅效果与Llama 3 8B相当，而且一次性开源了全部训练过程和资源。要知道，不久前Nature杂志编辑Elizabeth Gibney还撰文批评：许多声称开源的AI模型，实际上在数据和训练方法上并不透明，无法满足真正的科学研究需求。 ...……更多

2024-07-23 09:33:00苹果,一口,模型,一口气,训练,过程

容联云入选IDC生成式AI图谱，多个案例被评典型应用

...的尝试基于pre-training大模型的自动语料扩展、小样本数据训练、分布式机器学习、强化学习，利用模型能力的数据聚类、智能纠错、主题抽取、知识图谱、文档生成等很多智能化任务的研究。在智能化应用的模型训练方面采用了...……更多

2024-03-01 11:00:00被评,图谱,生成,典型,多个,案例

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...上做出大突破。与DALL・E一样，两点依旧是CLIP模型，除了训练数据庞大，CLIP基于Transformer对图像块建模，并采用对比学习训练，最终帮助DALL・E2取得了不错的生成效果。下图是DALL・E2根据“一只戴着贝雷帽、穿黑色高领毛衣的柴...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

一个5月份完成训练的大模型，无法对《黑神话·悟空》游戏内容相关问题给出准确回答。这是大模型的老毛病了。因为《黑神话》8月才上市，训练数据里没有它的相关知识。众所周知，大模型的训练和微调会消耗大量计算资源...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

ai绘画侵权实锤，扩散模型可能记住你的照片

...绘画侵权，实锤了！最新研究表明，扩散模型会牢牢记住训练集中的样本，并在生成时“依葫芦画瓢”。也就是说，像StableDiffusion生成的AI画作里，每一笔背后都可能隐藏着一次侵权事件。不仅如此，经过研究对比，扩散模型从...……更多

2023-02-03 22:00:00绘画,侵权,模型,照片,模型,训练

Llama3.1根本卖不动！业内人士：开源模型成本反而更高

...的开源和软件开源有本质区别——开源模型因其并未开放训练源代码、预训练和精调数据等影响模型效果的关键信息，所以无法像开源软件一样，靠社区开发者一起参与来提升效果和性能，而基座模型的训练只能掌握在厂商自己...……更多

2024-08-28 09:44:00业内人士,模型,业内,根本,人士,成本

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...了首个全球大规模轨迹数据集 WorldTrace，并基于该数据集训练了首个世界轨迹基础大模型 UniTraj，为交通领域内构建通用时空智能提供了一种全新的思路。研究团队提出了轨迹基础模型的构建范式，旨在通过其模型架构设计和数...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

清华全球最大双臂机器人扩散大模型RDT，懂调酒能遛狗，登顶热

...一。更惊喜的是，清华团队已将 RDT 的代码、模型，甚至训练它的双臂数据集彻底开源。他们坚信，开源 RDT 能极大加速机器人研发和产业化进程。项目主页：https://rdt-robotics.github.io/rdt-robotics 论文链接：https://arxiv.org/pd……更多

2024-10-21 09:55:00清华,双臂,机器人,模型,机器,全球

聚焦2024中国国际数字经济博览会·访谈丨北京智源人工智能研

...展现的能力尚不足以支持专业应用，其主要原因在于模型训练缺乏高质量可用的行业数据集。为解决大模型垂直领域训练数据稀缺与质量问题，推动大模型在千行百业的应用创新与发展，中国互联网协会、中国人工智能产业发展...……更多

2024-10-27 07:53:00总工,总工程师,人工智能,北京,中国,博览会