• 我的订阅
  • 头条热搜
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
2024-02-04 10:57:47 作者:姚立伟2月4日消息,研究人员发现网络上的大量内容都经过机器翻译(MT)的处理,且翻译质量普遍较低。这一现象引发了对训练大型语言模型时数据来源考量的重要性的关注。研究团队开发了一项名为“...……更多
...能对话年——生成式人工智能工具开启了一个充满希望和陷阱的新世界》的文章,作者是斯蒂芬·奥尔内斯。文章摘编如下:2023年初,大型语言模型风靡全球。可以说,聊天生成预训练转换器(ChatGPT)领导了这场革命。交互式聊天...……更多
...地感受到未来已来。新技术的发展,有时会伴随着悖论和陷阱。面对AI市场这片蓝海,人工智能带来的六大陷阱需要引起高度警惕。一、数据安全陷阱:你的“AI朋友”能守口如瓶吗在科幻电影中,因为数据泄露带来的安全隐忧...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明,大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合...……更多
Nature封面:AI训AI 越训越傻
...等学校机构的研究人员最新发现,使用合成数据训练,大模型可能会崩溃。其研究成果被选为最新的Nature封面。直接一个:GARBAGE OUT!要知道,现在绝大部分科技公司的大模型都在用合成数据来缓解“数据荒”。这下无疑是整个...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
百川智能发布baichuan3稳定语言模型
1月29日,百川智能发布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表...……更多
ChatGPT席卷全球,内容产业最先被革命?
...挥生成式人工智能(Generative AI)作用,以及基于预训练模型技术的文学创作辅助算法领域进行探索。这一次,双方将AIGC技术扩展至了漫画、动画、视频等IP衍生业务领域的新型内容生产方式上,并将共建AIGC技术在文学创作领域...……更多
...根据差异进行识别?AI检测工具如何应对越来越聪明的大模型?带着这些问题,记者采访了有关专家。AI创作套路化明显“虽然大模型在不断发展迭代,但到目前为止,AIGC与人类的创作在用词用语、逻辑语法等方面依旧存在明显...……更多
...及其他初创公司提供的类似工具,都整合了人工智能语言模型。但如果没有互联网上免费获取的海量文本,这些聪明的机器人作家将无法问世。如今,网页内容再次成为争夺的焦点。这种情况自早期搜索引擎之争以来就没有出现...……更多
...理世界,也是我们特别看中的一个前瞻性方向。3.甜蜜的陷阱「暗涌」:回头看,为什么中国的“AI四小龙”和大厂AI lab集体错过了ChatGPT?宋春雨:像商汤、旷视这样的企业,很多被现实逼迫去做系统集成,错失了生成式AI这一...……更多
...出,用人工智能(AI)生成的数据集训练未来几代机器学习模型可能会污染它们的输出,这个概念称为“模型崩溃”。该研究显示,原始内容会在AI数代内变成不相关的胡言乱语,显示出使用可靠数据训练AI模型的重要性。生成式AI...……更多
AI大模型,进入攻防阶段
...愈演愈烈,如今网上正在涌现出不少针对AI大模型设置的陷阱,他们的做法是通过插入特殊数据,破坏AI的数据库,使其产生完全错误的回答。最终迫使开发者回滚相关数据版本,并主动避开产生错误数据的网站,以达到保护自...……更多
AI领域将面临数据墙:高质量语言数据枯竭 可能减缓训练进展
...联网高质量数据枯竭,AI领域面临“数据墙”。对于AI大模型公司来说,现在的挑战是找到新的数据源或可持续的替代品。据权威研究公司Epoch AI的前瞻性分析,至2028年,互联网上的所有高质量文本数据或将被悉数采撷,而机器...……更多
共赢生成式AI时代
...更前沿、更有价值的业务场景。第二是选择合理的工具和模型。生成AI无比强大,但模型和工具的选择也很多,企业需要根据业务和场景选择最适合的模型和工具,因为没有一个模型能够适用于所有场景。第三是数据战略。选择合适...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大学的研...……更多
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
出品 | 搜狐科技作者 | 梁昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上,商汤正式发布“日日新SenseNova”大模型体系。这一大模型体系的名称取自《礼记·大学...……更多
为什么喜剧演员不用AI?原因在于OpenAI阻止大模型产出冒犯型内容
...的有用性。他们发现,尽管 OpenAI 和谷歌的流行人工智能模型在简单的任务上很有效,比如构建独白或制作粗略的初稿,但它们很难制作出原创、刺激或有趣的内容。本月早些时候,他们在巴西里约举行的 ACM FAccT 会议上介绍了...……更多
AI PC是噱头还是更快的马车?
...说需要一辆更快的马车。” “更快的马车”是一种消费陷阱,认为AI手机、AIPC只是噱头的人们可能只是基于惯例认为自己暂时不需要更新马车。更深层次的,是大众对AI的落地有一些误解,表现为两种极端:一种极端是认为那...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...ama 1的研发人员所做的事情。我所说的「不要陷入Chinchilla陷阱」就是这个意思。模型架构相比Llama 2, Llama 3的架构没有太多变化,但是在扩展数据的规模和质量方面,我们作出了很多努力,数据集从2T token增加到15T token。 架构...……更多
ChatGPT大流行的思考-解析篇
...对话,这是为什么?可以从以下两个维度来解答:(1)模型的本质区别首先我们要了解的是chatGPT是采用了LLM模型构建的对话机器人(large Language Model);一般的语言模型处理任务的类型大致分为两种类型:中间任务及最终任务...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这...……更多
纽约大学教授 Nature 发文:为了科学界的未来
免费的ChatGPT用的是很爽,但这种闭源的语言模型最大的缺点就是不开源,外界根本无法了解背后的训练数据以及是否会泄露用户隐私等问题,也引发了后续工业界、学术界联合开源了LLaMA等一系列羊驼模型。最近Nature世界观栏...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
【新智元导读】UrbanGPT是一种创新的时空大型语言模型,它通过结合时空依赖编码器和指令微调技术,展现出在多种城市任务中卓越的泛化能力和预测精度。这项技术突破了传统模型对大量标记数据的依赖,即使在数据稀缺的情...……更多
...,就交给专业的工程师去做,科普部分不再赘述。大语言模型vs中医药2016年,AlphaGo在围棋比赛对战世界围棋冠军李世石,结果以AlphaGo的胜利告终。这场比赛标志着人工智能在复杂决策和创造性领域的突破。2022年,OpenAI的大语言...……更多
大模型到了该「验收」的时候
...惠真正大众的时间,来得更早了一些。2024年9月,整个大模型产业,来到了一个微妙的时间窗口。一方面,是海外AI明星项目的接连“换血”与“卖身”。Runway深陷“删库跑路”风波;Stability AI在管理层大换血后再传资金链断裂...……更多
百度文心一格总架构师肖欣延:历程坎坷但未来已至,大模型赋能智能内容生成|WISE2023颠覆AIGC产业发展峰会
...上,百度文心一格总架构师肖欣延发表了题为《跨模态大模型赋能智能内容生成》的主题演讲。在肖欣延看来,生成式人工智能时代已经到来,内容生成将成为新一代生产方式,带来行业发展的新机遇。肖欣延分别从图片生成与...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
大型语言模型(LLMs)是指采用机器学习技术,利用大量文本数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生...……更多
更多关于科技的资讯:
各家都在学华为,又一家即将量产三折手机,之后小米也要发!
根据博主数码闲聊站的消息,荣耀将量产商用三折叠屏手机,继华为之后再次推动折叠屏技术的进步。荣耀CEO赵明表示,荣耀在三折
2024-09-22 22:45:00
鸿蒙NEXT Beta版:虽招募延期,但更新不断!
在这个快速迭代的科技时代,不仅手机产品之间的竞争非常激烈,对于手机厂商来说,系统更新也是需要大幅度的迭代。而根据如今市场传出的消息
2024-09-22 22:47:00
华为秋季发布会突然定档
随着时间的推移,华为的新动作开始进行加速,不仅要带来一系列给力的新品,在生态环境方面的发展也是一直都没有停止。而且华为的发布会也是逐渐和大家进行见面
2024-09-22 22:49:00
游戏表现谁更强?锐龙7 9700X对比i7-14700K实测
伴随着最近《黑神话:悟空》带来的游戏热潮,不少玩家开始接触或者重返游戏世界。但随之而来的就是很多人的电脑配置也受到了全新一代大作的挑战
2024-09-22 22:33:00
马甲换三代!曝明年AMD和英特尔都将发新马甲移动U
今年下半年到明年上半年的这段时间又是硬件玩家们关注的集体换代时间。在CPU部分,目前AMD已经率先带来了锐龙9000系列桌面处理器以及锐龙AI300系列APU
2024-09-22 22:33:00
苹果iPhone 16快充峰值39W 全程基本不到27W
在前几天的认证信息中显示,苹果iPhone16全系均提供最高15V/3A的充电功率,相比此前的30W快充支持,提升幅度非常大
2024-09-22 22:34:00
Redmi Note 14下周见 抗摔防水品质大换代
Redmi品牌总经理王腾在9月19日透露,Note14系列,下周见!新一代小金刚,品质大换代!RedmiNote14在品质上升级颇多
2024-09-22 22:34:00
iQOO Z9 Turbo+通讯能力大升级
今天本来是星期天,应该是各品牌都休息的时候。没想到大周天的iQOO竟然没有休息,持续预热即将在24日发布的iQOOZ9Turbo+这款机型
2024-09-22 22:34:00
发布会一个接一个,接下来vivo可太忙了
虽然大家都知道在10月份国产旗舰将会出现一个井喷的现象,但目前只有vivoX200系列正式确认了发布日期,其它品牌还没有对外官宣
2024-09-22 22:35:00
vivo称王亚太市场,小米第三,OPPO在跌
9月18日分析公司“TechInsights”给出了2024年第二季度亚太地区智能手机市场报告,报告称在过去的第二季度亚太地区智能手机同比增长8%
2024-09-22 22:42:00
Redmi K80已入网 搭载骁龙8 Gen4芯片
今日,RedmiK80系列获得入网许可,包括K80和K80Pro两款机型,型号分别是24122RKC7C和24117RK2CC
2024-09-22 22:43:00
刘作虎曝光OPPO Find X8谍照
iPhone的热度已经大不如前,反倒是国内旗舰手机的一举一动都受到了网友的关注,据悉OPPOFindX8系列将会在不久之后正式发布
2024-09-22 22:44:00
赔惨了!卖不出去还要倒贴,黄牛拒收iPhone 16 Pro
今日,苹果iPhone16系列正式发售,但从黄牛的反馈来看,今年的新机整体加价情况不如去年。在南京东路门店附近,有国内新闻记者通过现场观察至少五名黄牛
2024-09-22 22:44:00
苹果再陷欧洲集体诉讼风波,被指赚取巨额不正当利润
近日,欧洲消费者权益保护组织Euroconsumer在比利时、意大利、西班牙和葡萄牙四国联手对苹果公司发起了一项集体诉讼
2024-09-22 22:44:00
iQOO Z9 Turbo+官宣!搭载6400mAh超薄电池
今日,iQOO宣布将于9月24日19点发布全新的iQOOZ9Turbo+。官方表示,这款手机在性能和续航方面都进行了显著升级
2024-09-22 22:45:00