• 我的订阅
  • 头条热搜
上海人工智能实验室公布首个ai高考全卷评测结果
...20日消息,上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍,2024年全国高考甫一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...能力测试。6月19日, OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生...……更多
首个AI高考全卷评测结果发布:数学全都不及格
6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排...……更多
国内首个官方“大模型标准符合性评测”公布
...方公众号,在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与价值观七大能力;针对...……更多
...技术生态、产业生态和开放性等多个维度进行评估,确保评测结果客观真实。此次评测结果将形成针对特定应用场景的综合报告和产品推荐目录,为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。在评...……更多
...考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果,大模型的语文、英语考试水平还不错,但数学都不及格,最高分只有75分(满分150分)。参加OpenCompass此次高考测试的大模型,分别是来自阿里巴巴、零一万物、...……更多
击败Gemini-1.5-Pro、GPT-4V,从容大模型多模态能力跻身全球前三
...平台 OpenCompass 的多模态评测领域中取得重大进展。最新评测结果显示,云从科技的从容大模型在该体系中的平均得分为 65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v,仅次于 GPT-4o(69.9)和 Clau...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
...代替学生去高考,会怎么样?欸,还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...了多任务、多模态的通用视觉评测基准,可以提供权威的评测结果,推动基于统一标准的公平和准确评测,加快通用视觉模型的产业化应用步伐。通过开源社区的建设,OpenGVLab帮助开发者显著降低通用视觉模型的开发门槛,用更...……更多
商汤科技发布“书生·浦语”大模型 中文考试超越ChatGPT
...含1.6万亿token的多语种高质量数据集”训练而成。从全面评测结果来看,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力。其在综合性考试中更是表现突出...……更多
当技术越来越智能,我们如何守护安全?
...数字取证、异常检测技术的关注,到最近3年又扩展到了人工智能、深度学习和隐私保护的相关的技术上。“随着人工智能的发展,我们已经很重视相关的安全问题,比如像人工智能算法可能会在对抗攻击的情况下被误导。”清...……更多
大模型像“文科生”?业内人士在沪“论战”
...型自我学习和迭代能力还不足,计算效率还不高。不管是人工智能整体发展,还是大模型具体“升级”,业内人士适逢人工智能时代,看到的希望重重,遇到的挑战也重重。另外,在罗璇看来,人工智能的未来总体方向是通用的...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...及百川模型。本次测试提供了一个有趣的视角来观察当前人工智能大模型的发展状况。偏见测试结果得分以绝对值形式呈现,旨在凸显不同大语言模型在性别视角下处理问题的偏见程度,也揭示了它们在不同领域的优势和不足。...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
本文转自:新华网作为人工智能领域最重要的突破性进展之一,大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日,在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工...……更多
“整活”保险业务,AI大模型哪家强?
...的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。两大模型 领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...情况,并启动了AI安全守护计划,发布了三大类别的安全评测结果。AIIA安全治理委员会成立于2023年12月底,经过半年运营,现有治理组、安全组两个工作组,近百家单位加入,主任单位由中国信通院牵头,副主任单位包括多家知...……更多
AI潮起 共筑数智之基
...0+项评测指标、200+项评测场景、100多万专属评测数据集,评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体,支持评测数据自学习、用例自编排、执行自适应,同比评测周期缩短90%以上,已服务政府部委...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评测指标与方法》语言大模型的相关技术要求,通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...回答,引发掌声不断。刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他进一步公布大模型年内三...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...一致时,就会推翻 “假设”,重新尝试新的假设。 人类评测结果人类在 VCR 任务下的水平如何呢?下图中展示了母语者或各语言的流利使用者在英 / 中两种语言的简单 / 困难设定下的准确度:如果考虑包含时间、地名、人名的...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...玩笑说法,但实际上也是一种趋势。除此之外,他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础...……更多
...。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电信人工智能研究院便...……更多
融资超25亿元,他们的目标和OpenAI很像
...大模型的元年不是2023年,而是2020年。因为2020年6月美国人工智能研究公司OpenAI发布了GPT-3(生成式预训练模型),曾被业界认为是当时的技术巅峰之作。 “2015年成立的OpenAI最开始是一家人工智能研究实验室,主要关注强化学习...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...用成果。刘庆峰在现场演讲中表示,ChatGPT在全球引起了人工智能的全新的浪潮,各行各业都在拥抱这个巨大的变革和机会,传统意义上通过堆时长、堆人力的商业模式将被根本性的颠覆。他提到,当前对通用人工智能系统的需...……更多
华藏生态共创,为大模型商业变现注入活力
...展目标,引领全球通用大模型的成果落地与商业变现,为人工智能发展注入取之不尽、用之不竭的活力。以商业变现为核心,为何小i可以建成华藏生态?\"商业变现\"是华藏生态的核心所在。发布会上,小i集团董事局主席兼CEO袁...……更多
宏碁传奇Edge 16评测:搭载内置Ryzen AI引擎的锐龙7 7840U
在这个万物互联的时代,人工智能早已渗透到各行各业,日常生活中接触的数码电子产品,几乎都实现了智能化,而作为重要生产力工具的PC,除了硬件性能上的提升,机身、屏幕的变化外,与AI人工智能似乎毫不相干,但这并...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。【来源:凤凰网科技】返回搜狐,查看更多责任编辑: ……更多
更多关于科技的资讯:
竞争激烈!通用汽车调整绩效考核体系:劳模奖金翻倍、平庸者离开
快科技8月4日消息,在汽车行业竞争日益激烈的背景下,通用汽车开始对其员工绩效评估体系进行重大调整。根据一份内部备忘录,通用汽车将改变其在美国的员工绩效考核方式
2024-08-04 18:07:00
特斯拉得州工厂发生死亡事件:监管机构进行调查
快科技8月4日消息,据媒体报道,本周特斯拉位于得克萨斯州的超级工厂不幸发生一起人员死亡事件,此事件迅速引起了联邦相关监管机构的关注并启动了全面调查程序
2024-08-04 18:07:00
2000元级第一神卡!RTX 3060挣扎半年 终于停产了
快科技8月4日消息,x60系列显卡一向是主流用户和玩家最为喜爱的,也是极为长寿的,但花无百日红,上一代的RTX 3060终于还是要停产了
2024-08-04 18:07:00
SK海力士明年量产400层闪存!能让SSD更便宜吗?
快科技8月4日消息,据报道,SK海力士正在开发400层堆叠的NAND闪存,将于2025年投入大规模量产,再次遥遥领先。为了达成如此密集的堆叠
2024-08-04 18:37:00
以旧换新最高补贴4.5万!2024款领克01最新购车政策发布
快科技8月4日消息,领克汽车最近宣布了2024款领克01燃油版的购车优惠政策,以吸引更多消费者。从2024年8月1日至9月30日
2024-08-04 18:37:00
乔斯伯推出CR-3000E系列风冷散热器:双塔双风扇六热管设计
快科技8月4日消息,乔思伯推出了CR-3000E系列风冷散热器,分为标准版和彩色版。乔思伯表示,随着CPU功耗不断提升
2024-08-04 19:07:00
派了个杀手参加奥运?土耳其运动员一夜爆红 网友疯狂玩梗
土耳其射击运动员Yusuf Dikec在男女混合10米气手枪射击比赛中获得银牌,然后网络就被他那种从容的姿态引爆了。他在比赛时看起来没有穿戴任何专业装备
2024-08-04 19:07:00
南非惊现S型脖子的长颈鹿!还有更诡异的L型、Z型
近日,有人在南非的一处私人野生动物保护区里,发现了一只脖子呈“S”型的长颈鹿,被发现时,它正在淡定吃草。这让观测者很惊讶
2024-08-04 19:37:00
《魔兽世界》正式服扩容 大幅缓解排队:玩家怒气冲天
快科技8月4日消息,《魔兽世界》官方宣布,部分正式服服务器已经完成扩容,包括死亡之翼、白银之手、罗宁、托塞德林(包括凤凰之神)
2024-08-04 20:07:00
每小时1万多公里!土星将一颗彗星狠狠甩出太阳系
宇宙之大,无奇不有。天文学家最近发现,作为太阳系第二大行星的土星,将一颗高速运行的彗星,已超过1万公里每小时的速度,抛出了太阳系
2024-08-04 21:37:00
北京商报讯(记者 胡静蓉)8月4日,SOLANA蓝色港湾发布内容显示,第三届SOLANA艺术季将持续至10月7日。蓝色港湾将艺术作品放到商区及30余家品牌店铺
2024-08-04 22:17:00
小米显示器线上销量第三 华为未能进入榜单
根据洛图科技刚刚发布的《中国大陆显示器线上零售市场月度追踪》报告,在2024年上半年中国大陆显示器整体线上零售市场销量为495万台
2024-08-04 12:36:00
扎克伯格与黄仁勋共谈AI,不仅现场爆粗口,最后还互赠皮衣
美国当地时间7月29日晚,在丹佛举行的SIGGRAPH2024计算机图形大会上,Meta创始人扎克伯格与英伟达CEO黄仁勋举行了对话
2024-08-04 12:36:00
华为计划9月发布三折叠手机:全球第一款,研发时间长达5年
目前折叠屏手机已经成为了各大手机厂商的流量密码,而且随着技术的进步,折叠屏手机的定价也不断地降低,已经成为了普通消费者可以承担的地步
2024-08-04 12:36:00
华为预热小折叠机nova Flip、易烊千玺代言
在7月29日早上,华为终端官微发布了一段视频,预告了即将发布由易烊千玺代言的小折叠手机novaFlip,这也是华为首款采用方形外屏的小折叠机
2024-08-04 12:36:00