• 我的订阅
  • 头条热搜
全球AI安全评估测试有了新基准
...域两项国际标准发布全球AI安全评估测试有了新基准随着人工智能系统,特别是大语言模型成为社会各方面不可或缺的一部分,以一个全面的标准来解决它们的安全挑战变得至关重要。◎本报记者 崔 爽第27届联合国科技大会期间...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高...……更多
2023 AI现状报告:GPT-4仍最强,监管方向缺乏全球共识
·随着尖端人工智能系统变得更加强大和灵活,比较它们的能力越来越困难。由于基准变得不那么明确,用于评估大语言模型的“基于氛围”的方法在业界越来越普遍。·人工智能安全在2023年首次占据舞台中心。但人工智能界内...……更多
国际组织WDTA首次就大模型安全发布国际标准,蚂蚁集团、OpenAI、科大讯飞等参编
...技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...通讯作者为从鑫与林衍凯,指导教师为刘知远副教授。在人工智能迅猛发展的今天,我们不断探索着机器的智能化,但却往往忽视了这些智能体如何深层地理解我们 —— 它们的创造者。我们人类在生活中的每一次互动,每一句...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com具身智能是实现通用人工智能的必经之路,其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。近年来,多模态大模型和机器人技术得到了长足发展,具身智能成为全球科技和...……更多
从“智能涌现”到“超人类”,通往AGI巅峰的终极设想
...世界会多么接近他的科幻梦想。如今,我们生活在一个由人工智能(Artificial Intelligence, AI)渗透的世界里。AI系统在许多方面已超越阿西莫夫的想象——在家里,私人AI助手不仅可以帮你安排日程,还能根据你的心情推荐娱乐节...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Grok-2将于8月发布,在回应用户关于训练数据的提问时,他表示该模型将在这方面做出...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...衔的基础理论创新团队发起。长期以来,团队着眼于目前人工智能发展的瓶颈问题,探索原创性人工智能理论和关键技术,在智能算法的对抗安全理论和方法研究中处于国际领先水平,深入研究深度学习的对抗鲁棒性和数据利用...……更多
杭州日报讯 在科技的浪潮中,大模型人工智能(AI)的崛起,如同打开了潘多拉魔盒,释放出无限可能的同时,也带来了前所未有的挑战。从OpenAI的GPT系列到谷歌的BERT,再到国内的百度文心一言、阿里巴巴通义千问、腾讯混元...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...源:网络斯坦福大学计算机科学系和电子工程系副教授、人工智能实验室主任吴恩达(AndrewNg)在社交媒体上称赞\"Meta和Llama团队对开源的巨大贡献\"。他表示:\"Llama3.1增加了上下文长度和改进了功能,是送给每个人的奇妙礼物...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...不是与开源模型竞争,而是要超过所有人,打造最领先的人工智能。他提到,今年晚些时候发布的Llama 3-400B将在许多基准测试中领先,并已经在考虑Llama 4和5。英伟达高级科学家Jim Fan认为,Llama 3-400B以上的版本其将成为某种“分...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...」工作——创建大量的图像、音频片段等信息,用来训练人工智能工具或自动驾驶汽车。 另外的40%则是实打实的程序员,他们正在为OpenAI的模型「手搓」数据,从而让AI学习软件工程任务。此前,OpenAI一直是用从GitHub上抓取的...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。两大模型 领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...大模型与具身智能研究,取得了一系列重要研究成果,在人工智能顶级期刊和会议上发表论文 80 余篇,谷歌引用 9700 余次。荣获世界人工智能顶会 AAAI 最佳论文奖,位列世界最大学术源代码仓库 Trending Research 第一位。为了赋予...……更多
全球第一!新华三服务器再破SPEC世界纪录
...日,国际标准性能评估组织SPEC正式公布最新一期CPU性能基准测试结果(截至2023年2月),紫光股份旗下新华三集团H3CUniServerR4900G6服务器在SPECCPU®2017测试中以174分的FloatingPoint最高分,刷新该项测试成绩世界纪录。这是继2022年打...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...言搜索照片,制作影片为邮件、信息和语音邮件转录生成人工智能摘要此外,还有一些功能,苹果表示将在明年推出,包括ChatGPT集成、图像/Emoji生成、照片自动清理、具有屏幕感知的超强Siri。顺便提一句,目前,iOS18.1测试版(...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...;zhaoyunfeng@jiqizhixin.com本文作者张天宇,就读于加拿大Mila人工智能研究所,师从图灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器...……更多
12月7日消息,美国当地时间周三,谷歌发布了其新一代人工智能模型Gemini。Gemini反映了谷歌内部多年来在首席执行官桑达尔·皮查伊(Sundar Pichai)的监督和推动下所做的努力。此前负责Chrome和安卓业务的皮查伊是出了名的产品...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
3 月 29 日消息,马斯克旗下人工智能公司 xAI 今天在官方博客中宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未...……更多
国产chatgpt何时能出?百度站出来了最快3月评分全球第一
最近ChatGPT火爆全球,这种对话式AI人工智能凭借过人的智商、超高的准确率震撼了世人,而对国内用户来说,中国这么多研究AI技术的公司,什么时候有对标ChatGPT的产品?在这件事上,百度站出来了,最快3月份发布国产版ChatGPT...……更多
在 OpenAI 公布的技术论文里,竟然藏着九大隐秘的线索!
...、不良规范的扩散、AI发展进程的加速,它们都加剧了与人工智能相关的社会风险。但很奇怪的一点是,OpenAI所提到的担忧,尤其是“AI发展进程的加速”,似乎是与微软高层的想法背道而驰。 因为在此前的爆料中称,微软CEO和...……更多
英伟达联手Zilliz发布全球首个GPU加速向量数据库
...来的产业,开辟量子技术、生命科学等新赛道,还要开展人工智能+的行动。3、国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”23日在2024全球开发者先锋大会上正式发布。财跃星辰由上海报业集团旗下界面财联社...……更多
深度剖析:谷歌、微软等AI巨头承诺的“自愿监管”做到了吗?
...微软、谷歌、Meta、OpenAI、Anthropic 和 Inflection 在内的七家人工智能公司与白宫就如何以安全可信的方式开发人工智能达成了八项自愿承诺。这些承诺包括提高对人工智能系统的测试和透明度,并分享有关潜在危害和风险的信息等...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
智东西7月24日报道,今日,中国人工智能产业发展联盟(AIIA)安全治理委员会举办了成果发布会。会上,中国信息通信研究院人工智能研究所安全与元宇宙部主任石霖,解读了成立半年来委员会形成的组织架构,安全、治理两...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...PU(张量处理单元)系统“Cloud TPU v5p”以及来自谷歌云的人工智能超级计算机。v5p是今年早些时候全面推出的Cloud TPU v5e的更新版本,谷歌承诺其速度明显快于v4 TPU。一年前,在人工智能开发机构OpenAI发布聊天机器人ChatGPT后,创...……更多
更多关于科技的资讯:
金士顿推出 DC2000B 服务器固态启动盘:PCIe 4.0×4,至高 960GB
IT之家 8 月 20 日消息,金士顿今日宣布推出 DC2000B 企业 / 数据中心级固态硬盘。该盘容量可选 240 / 480 / 960 GB
2024-08-21 09:22:00
消息称松下将与斯巴鲁、马自达合作打造电动汽车电池生产基地
IT之家 8 月 20 日消息,读卖新闻报道称,松下控股已就与斯巴鲁和马自达合作在日本建立电动汽车电池生产基地达成最终协议
2024-08-21 09:23:00
绿色能源背后的隐忧:非洲马拉维太阳能电池废料引发严重铅污染危机
8 月 20 日消息,非洲东南部内陆国家马拉维的太阳能电池废料正引发一场严重的公共健康危机。据曼彻斯特大学的一项新研究
2024-08-21 09:24:00
谷歌安卓版 Chrome 浏览器测试新特性:共享屏幕时可屏蔽敏感数据
IT之家 8 月 20 日消息,消息源 @Leopeva64 于 8 月 17 日发布推文,表示安卓版 Chrome 浏览器正在测试名为“敏感内容保护”的实验性 Flag
2024-08-21 09:25:00
微软推出 Xbox 手柄“苍穹秘语”版:蓝色半透面盖,售 599 元
IT之家 8 月 20 日消息,据微软“Xbox”官方微博,微软Xbox Series X|S手柄“苍穹秘语”特别版目前已在京东上架
2024-08-21 09:25:00
微软邀测 2.0 版 Loop:启用新域名、引入新界面、提升使用体验
IT之家 8 月 20 日消息,微软公司昨日(8 月 19 日)发布新闻稿,邀请部分用户测试全新的 2.0 版 Microsoft Loop
2024-08-21 09:26:00
AI“炙烤”数据中心,用水、用电量飙升
IT之家 8 月 20 日消息,根据美国能源信息署(EIA)本周一公布的最新报告,美国供电公司和发电厂 2024 年上半年(1-6 月)新增公用事业级发电能力 20
2024-08-21 09:27:00
苹果 macOS 版微软 365 应用存漏洞,黑客可绕过权限执行恶意操作
IT之家 8 月 20 日消息,网络安全公司 CiscoTalos 最近发现,macOS 版微软 365 应用存在八个漏洞
2024-08-21 09:28:00
大疆杀入无反相机市场?消息称 9 月宣布重大消息
IT之家 8 月 20 日消息,据外媒sonyalpharumors 报道,两位“值得信赖的消息人士”称,大疆可能会在 9 月份宣布一些重大消息
2024-08-21 09:29:00
填补国产空白,开目三维制造成本分析与估算软件 3DDFC 发布
IT之家 8 月 20 日消息,据光谷融媒体中心官方今日消息,光谷企业武汉开目信息技术股份有限公司(以下简称“开目软件”)近日发布了其最新研发成果 —— 开目三维制造成本分析与估算软件 3DDFC
2024-08-21 09:31:00
首批万人测试已招满,OpenAI 关闭 SearchGPT 候补名单
IT之家 8 月 20 日消息,OpenAI 公司已经关闭 SearchGPT 候选名单,仅邀请 10000 人参与测试
2024-08-21 09:32:00
Firefox浏览器厂商 Mozilla 被曝酝酿新 LOGO:“://”改为小旗子
IT之家 8 月 20 日消息,德国科技博主索伦・亨茨谢尔(Sören Hentzschel)发布博文,在 Mozilla 公司的“Nothing Personal”页面上
2024-08-21 09:32:00
“全球最小扫地机器人”SwitchBot K10+ Pro 发布
IT之家 8 月 20 日消息,SwitchBot 推出了 K10+ Pro 扫地机器人,号称是“全球最小的家用扫地机器人”
2024-08-21 09:33:00
索泰发布第 13 款RTX 4070显卡:鼓风扇设计、兼容SFF-Ready 规格
IT之家 8 月 20 日消息,科技媒体 videocardz 昨日(8 月 19 日)报道,索泰(ZOTAC)计划发布第 13 款 GeForce RTX 4070 显卡
2024-08-21 09:34:00
Milan 项目再续,Meta 被曝重启开发智能手表
IT之家 8 月 20 日消息,消息源埃文・布拉斯(Evan Blass)在 X 平台发布推文,曝料 Meta 公司已重新开发智能手表项目
2024-08-21 09:35:00