• 我的订阅
  • 头条热搜
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
2024-02-04 10:57:47 作者:姚立伟2月4日消息,研究人员发现网络上的大量内容都经过机器翻译(MT)的处理,且翻译质量普遍较低。这一现象引发了对训练大型语言模型时数据来源考量的重要性的关注。研究团队开发了一项名为“...……更多
...能对话年——生成式人工智能工具开启了一个充满希望和陷阱的新世界》的文章,作者是斯蒂芬·奥尔内斯。文章摘编如下:2023年初,大型语言模型风靡全球。可以说,聊天生成预训练转换器(ChatGPT)领导了这场革命。交互式聊天...……更多
...地感受到未来已来。新技术的发展,有时会伴随着悖论和陷阱。面对AI市场这片蓝海,人工智能带来的六大陷阱需要引起高度警惕。一、数据安全陷阱:你的“AI朋友”能守口如瓶吗在科幻电影中,因为数据泄露带来的安全隐忧...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...这是该团队在继 PMC-LLaMA 后,在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中,大语言模型已经有了广泛的研究。然而,这些进展主要依赖于英语的基座模型...……更多
自然语言处理:大模型理论与实践
今天分享的是:自然语言处理:大模型理论与实践报告共计:450页《自然语言处理:大模型理论与实践》系统介绍了大模型技术在自然语言处理中的理论与实践。核心观点1. 语言模型基础- 介绍独热表示、分布式表示等文本表示...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明,大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合...……更多
Nature封面:AI训AI 越训越傻
...等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
...理世界,也是我们特别看中的一个前瞻性方向。3.甜蜜的陷阱「暗涌」:回头看,为什么中国的“AI四小龙”和大厂AI lab集体错过了ChatGPT?宋春雨:像商汤、旷视这样的企业,很多被现实逼迫去做系统集成,错失了生成式AI这一...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
...根据差异进行识别?AI检测工具如何应对越来越聪明的大模型?带着这些问题,记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代,但到目前为止,AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多
...出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”。该研究显示,原始内容会在AI数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。生成式AI...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...、张钊为、汪明志、钟伊凡等。团队就强化学习方法及大模型的后训练对齐技术开展了一系列重要工作,包括 Aligner(NeurIPS 2024 Oral)、ProgressGym(NeurIPS 2024 Spotlight)以及 Safe-RLHF(ICLR 2024 Spotlight)等系列……更多
AI大模型,进入攻防阶段
...愈演愈烈,如今网上正在涌现出不少针对AI大模型设置的陷阱,他们的做法是通过插入特殊数据,破坏AI的数据库,使其产生完全错误的回答。最终迫使开发者回滚相关数据版本,并主动避开产生错误数据的网站,以达到保护自...……更多
AI领域将面临数据墙:高质量语言数据枯竭 可能减缓训练进展
...联网高质量数据枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。据权威研究公司Epoch AI的前瞻性分析,至2028年,互联网上的所有高质量文本数据或将被悉数采撷,而机器...……更多
共赢生成式AI时代
...更前沿、更有价值的业务场景。第二是选择合理的工具和模型。生成AI无比强大,但模型和工具的选择也很多,企业需要根据业务和场景选择最适合的模型和工具,因为没有一个模型能够适用于所有场景。第三是数据战略。选择合适...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
为什么喜剧演员不用AI?原因在于OpenAI阻止大模型产出冒犯型内容
...的有用性。他们发现,尽管 OpenAI 和谷歌的流行人工智能模型在简单的任务上很有效,比如构建独白或制作粗略的初稿,但它们很难制作出原创、刺激或有趣的内容。本月早些时候,他们在巴西里约举行的 ACM FAccT 会议上介绍了...……更多
AI PC是噱头还是更快的马车?
...说需要一辆更快的马车。” “更快的马车”是一种消费陷阱,认为AI手机、AIPC只是噱头的人们可能只是基于惯例认为自己暂时不需要更新马车。更深层次的,是大众对AI的落地有一些误解,表现为两种极端:一种极端是认为那...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...ama 1的研发人员所做的事情。我所说的「不要陷入Chinchilla陷阱」就是这个意思。模型架构相比Llama 2, Llama 3的架构没有太多变化,但是在扩展数据的规模和质量方面,我们作出了很多努力,数据集从2T token增加到15T token。 架构...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...Alignment。3. 黄灿:厦门大学数学系副教授随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种现象在推...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...点在于,Llama 3.2成为羊驼家族中,首个支持多模态能力的模型。Connect大会上,新出炉的Llama 3.2包含了小型(11B)和中型(90B)两种版本的主要视觉模型。正如Meta所说,这两款模型能够直接替代,相对应的文本模型,而且在图像...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
【新智元导读】UrbanGPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情...……更多
...,就交给专业的工程师去做,科普部分不再赘述。大语言模型vs中医药2016年,AlphaGo在围棋比赛对战世界围棋冠军李世石,结果以AlphaGo的胜利告终。这场比赛标志着人工智能在复杂决策和创造性领域的突破。2022年,OpenAI的大语言...……更多
大模型到了该「验收」的时候
...惠真正大众的时间,来得更早了一些。2024年9月,整个大模型产业,来到了一个微妙的时间窗口。一方面,是海外AI明星项目的接连“换血”与“卖身”。Runway深陷“删库跑路”风波;Stability AI在管理层大换血后再传资金链断裂...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练,永远不会达到接近人类水平的智能。除此之外,他还谈到当前大模型的局限性、以目标驱动的AI架构,包括利用世界模型进行推理和规划,最...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应用领域,掀...……更多
更多关于科技的资讯:
AMD Ryzen 9 9950X3D跑分出炉:单核提升明显
近日,AMD的Ryzen 9 9950X3D和9900X3D处理器终于在Geekbench上亮相,相比上一代,新处理器在单核分数上有着明显提升
2025-02-19 22:57:00
中国香港人民爱买的车TOP20出炉:比亚迪第一 超特斯拉3倍
快科技2月19日消息,近日,易车公布了2025年1月中国香港人民最爱买的20款汽车品牌榜单,引发了广泛关注。在这份榜单中
2025-02-19 22:57:00
宇树科技老股转让遭“疯抢” 原始股东坚决不卖
快科技2月19日消息,据《科创板日报》报道,宇树科技的老股转让在一级市场中引发了一轮抢购热潮。有知情人士透露,近期众多投资者纷纷联系宇树科技的原始股股东
2025-02-19 22:57:00
网购电动车“续航神器”拆开似空壳 谨慎掉入“黑科技”骗局
近年来,随着电动自行车的普及,部分商家瞄准消费者对“长续航”的需求,推出所谓的电动车“续航增程器”,宣称可大幅提升续航里程
2025-02-18 19:32:00
美术院校校考,画风如何?
潮新闻讯 今天,中国美院本科招生(复试)开考。来自全国各地的考生涌向国美象山校区,转塘也一下子热闹起来。“今年会考什么
2025-02-19 20:18:00
OPPO Find X8 Ultra爆料汇总:双潜望机皇 影像巅峰
据可靠消息,下个月OPPO Find X8 Ultra有望登场,目前网上已经流出了诸多关于它的爆料。今天我们就来汇总这些曝光消息
2025-02-19 20:27:00
249元 影驰推出金属大师暗卫海景房机箱:270°无立柱海景房设计
快科技2月19日消息,影驰推出了金属大师暗卫机箱,采用270°无立柱海景房设计,首发到手249元。据悉,金属大师暗卫机箱采用了双面钢化玻璃
2025-02-19 20:27:00
虚幻5打造!腾讯《三角洲行动》官宣黑鹰坠落模式免费:2月21日全球上线
快科技2月19日消息,今晚,腾讯战术射击大作《三角洲行动》举行黑鹰坠落线下影院前瞻直播,公布黑鹰坠落战役模式部分关卡设计以及首次关卡实机试玩
2025-02-19 20:27:00
中新经纬2月19日电 市场监管总局网站19日消息,市场监管总局等五部门近日印发《优化消费环境三年行动方案(2025—2027年)》(简称“《方案》”)的通知
2025-02-19 20:29:00
二手平台买CPU收到一包沙子 卖家拒退款:这是CPU原材料
快科技2月19日消息,在网络购物日益普及的今天,消费者们需要格外谨慎,因为稍有不慎,就可能遇到一些令人哭笑不得、甚至离谱至极的事儿
2025-02-19 20:57:00
江南时报讯 为拓宽零售金融业务新渠道,延伸金融服务触角,推进医疗场景数字化运营,溧水农商银行积极响应民生需求,着力解决“一老一小”医保支付便捷度问题
2025-02-19 20:57:00
本文转自:人民网人民网北京2月19日电 (记者杜燕飞)当前,人工智能(AI)作为引领新一轮科技革命和产业变革的技术,具有很强的“头雁”效应
2025-02-19 21:00:00
如何量身打造新市民与灵活就业人群保险产品?泰康在线模式参考
有这样一个群体,他们勤勤恳恳、任劳任怨,引人关注,又默默无闻;他们早出晚归、披星戴月,远离故土,建设“第二故乡”。他们
2025-02-19 21:12:00
免费不限量!腾讯:混元T1模型面向所有用户开放
快科技2月19日消息,据腾讯介绍,前几天深度思考模型混元T1开启灰度后,用户反响强烈。经过产品紧急部署,现在,所有用户都可以无限量使用混元T1了
2025-02-19 21:27:00
网传小米全系车型规划:共8个版本 SU7猎装版很帅!
自从小米推出首款新车SU7以来,该车便获得了巨大的关注度和订单量,可以说为小米造车奠定了非常好的开局。近日,网传图片则曝光了小米汽车可能的全系车型
2025-02-19 21:27:00