• 我的订阅
  • 头条热搜
上海人工智能实验室公布首个ai高考全卷评测结果
...20日消息,上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍,2024年全国高考甫一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...能力测试。6月19日, OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海人工智能实验室的书生...……更多
首个AI高考全卷评测结果发布:数学全都不及格
6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)排...……更多
国内首个官方“大模型标准符合性评测”公布
...方公众号,在12月22日的全国信息技术标准化技术委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与价值观七大能力;针对...……更多
...技术生态、产业生态和开放性等多个维度进行评估,确保评测结果客观真实。此次评测结果将形成针对特定应用场景的综合报告和产品推荐目录,为政府、企业和研究机构建设智算中心提供芯片选型的重要参考和决策依据。在评...……更多
...考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果,大模型的语文、英语考试水平还不错,但数学都不及格,最高分只有75分(满分150分)。参加OpenCompass此次高考测试的大模型,分别是来自阿里巴巴、零一万物、...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
...代替学生去高考,会怎么样?欸,还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,...……更多
当技术越来越智能,我们如何守护安全?
...数字取证、异常检测技术的关注,到最近3年又扩展到了人工智能、深度学习和隐私保护的相关的技术上。“随着人工智能的发展,我们已经很重视相关的安全问题,比如像人工智能算法可能会在对抗攻击的情况下被误导。”清...……更多
大模型像“文科生”?业内人士在沪“论战”
...型自我学习和迭代能力还不足,计算效率还不高。不管是人工智能整体发展,还是大模型具体“升级”,业内人士适逢人工智能时代,看到的希望重重,遇到的挑战也重重。另外,在罗璇看来,人工智能的未来总体方向是通用的...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...及百川模型。本次测试提供了一个有趣的视角来观察当前人工智能大模型的发展状况。偏见测试结果得分以绝对值形式呈现,旨在凸显不同大语言模型在性别视角下处理问题的偏见程度,也揭示了它们在不同领域的优势和不足。...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
本文转自:新华网作为人工智能领域最重要的突破性进展之一,大模型正日益成为推动全球科技进步和经济增长的强劲动力。11月23日,在由中关村科金与中国信息通信研究院人工智能研究中心、人工智能关键技术和应用评测工...……更多
“整活”保险业务,AI大模型哪家强?
...的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根据《报告》,10个主流大模型在知识问答领域表现普遍较好,在智能核保、智能理赔、话...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。两大模型 领先行业昆仑万维「天工」Skywork-13B系列包括两大模型...……更多
AI潮起 共筑数智之基
...0+项评测指标、200+项评测场景、100多万专属评测数据集,评测结果客观性跻身国内外主流基准第一阵营。依托自研大模型评测智能体,支持评测数据自学习、用例自编排、执行自适应,同比评测周期缩短90%以上,已服务政府部委...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
...大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评测指标与方法》语言大模型的相关技术要求,通用性、智能性等维度达到国家相关标准。该测试由工信部中国电子技术标准化研究...……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...安全基准测试AI Safety Bench是中国信息通信研究院依托中国人工智能产业发展联盟(AIIA)安全治理委员会,联合17家单位发起的,秉持公平公正、产业应用和场景导向的原则,目标建立业内权威大模型安全中文基准测试体系。以提高...……更多
清华郑纬民院士:AI for Science的出现,让高性能计算与AI的融合成为刚需|MEET2023
...玩笑说法,但实际上也是一种趋势。除此之外,他还谈到人工智能计算机设计的三大平衡性原则、AI基准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考,在不改变原意的基础...……更多
...。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电信人工智能研究院便...……更多
融资超25亿元,他们的目标和OpenAI很像
...大模型的元年不是2023年,而是2020年。因为2020年6月美国人工智能研究公司OpenAI发布了GPT-3(生成式预训练模型),曾被业界认为是当时的技术巅峰之作。 “2015年成立的OpenAI最开始是一家人工智能研究实验室,主要关注强化学习...……更多
华藏生态共创,为大模型商业变现注入活力
...展目标,引领全球通用大模型的成果落地与商业变现,为人工智能发展注入取之不尽、用之不竭的活力。以商业变现为核心,为何小i可以建成华藏生态?\"商业变现\"是华藏生态的核心所在。发布会上,小i集团董事局主席兼CEO袁...……更多
宏碁传奇Edge 16评测:搭载内置Ryzen AI引擎的锐龙7 7840U
在这个万物互联的时代,人工智能早已渗透到各行各业,日常生活中接触的数码电子产品,几乎都实现了智能化,而作为重要生产力工具的PC,除了硬件性能上的提升,机身、屏幕的变化外,与AI人工智能似乎毫不相干,但这并...……更多
国家大模型标准测试结果公布 首批仅四家企业产品通过
...觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。【来源:凤凰网科技】返回搜狐,查看更多责任编辑: ……更多
...户体验是值得主机厂去尝试的新思路。此外,AIGC(生成式人工智能技术)进入车内,扩展智能座舱新场景: AIGC正在重塑我们与汽车的交互方式。AIGC技术在行程规划方面的应用具有革命性意义。通过综合分析用户的行为习惯、历史...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布……更多
2023移动网络质量“百城”专项评测:打造高质量的5G服务
...活动11月7日正式开启,来自中国信息通信研究院泰尔系统实验室5支专业的网络质量评测团队奔赴全国百余个城市,对重点和热点区域开展移动网络测试。其实“移动网络质量专项评测活动”已经开展了4年了,中国信息通信研究...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...到每一个人的身边。在不久前刚刚召开的全国两会上,“人工智能+”这个概念被首次写入到了政府报告当中。新质生产力引擎开启,万象新生时代正在来临。活动还通过总台央视网、小央视频视频号以及智谱AI视频号同步直播。...……更多
...大模型角逐“最强王者”查睿本报记者 查睿近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生...……更多
清华发布2024年3月版《SuperBench大模型综合能力评测报告》
...:新华网最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文...……更多
更多关于科技的资讯:
上汽大众回应南京工厂关闭:生产基地调整是必要的经营行为
快科技9月22日消息,据报道,上汽大众计划关闭中国工厂,南京工厂首当其冲,主要生产帕萨特和斯柯达车型。对此,市场上关于上汽大众南京工厂将关闭的传闻
2024-09-22 07:56:00
丽江,作为中国云南省的一个著名旅游目的地,以其独特的自然风光和丰富的民族文化吸引了大量游客。近年来,丽江旅游行业在不断发展与变革中
2024-09-22 09:17:00
全程用iPhone拍摄:好莱坞大片《惊变28年》2025年6月北美上映
快科技9月22日消息,据《Wired》报道,导演丹尼·博伊尔(Danny Boyle)执导的新片《惊变28年》(28 Years Later)将成为首部完全使用苹果iPhone拍摄的好莱坞大片
2024-09-22 09:26:00
《变形金刚》苦战《阴间大法师》
《变形金刚:起源》北美开画成绩低于预期,点映与周五场仅录得956万美元,距离燃爆全场相去甚远。这部动画片之前预计能取得至少3000万美元首周票房
2024-09-22 09:26:00
思科中国裁员补偿可选N+7 前员工:有同事拿着赔偿款到处旅游
快科技9月22日消息,据报道,思科计划启动今年新一轮裁员,预估影响4000名员工,中国区也有员工被波及。报道称,通过多位被裁员工确认
2024-09-22 09:26:00
世界五大绝症之首 蔡磊向清华捐赠支持渐冻症研究
快科技9月22日消息,据“清华大学基础医学院”公众号,日前,蔡磊-清华大学基础医学院捐赠仪式在清华大学医学院科学楼举行
2024-09-22 09:56:00
2024世界制造业大会:前沿科技为孩子埋下梦想种子
制造业是立国之本、强国之基。9月20日至23日,2024世界制造业大会在合肥滨湖国际会展中心拉开大幕,集中展示全球制造业领域的最新产品和重大创新成果
2024-09-22 09:59:00
海南免税版iphone16系列价格比苹果官网购买优惠一些
9月20日消息,今日,苹果iPhone16系列正式开售,售价5999元起,线上预定的首批用户今天将陆续收到新机。目前,海南免税版iPhone16系列价格已经出炉
2024-09-22 10:05:00
毛孔疗法行业近年来经历了显著的发展和变革,特别是在互联网技术的推动下,行业正迎来新的机遇和挑战。毛孔问题一直是美容护理领域中的一个热门话题
2024-09-22 10:18:00
如约而至!自然堂携手家家悦举行“2024·美在巴黎”冠军见面活动
大众网记者 王珏 通讯员 王迎超 威海报道9月21日,自然堂携手家家悦,在威海九龙城购物广场举办了“2024·美在巴黎”冠军见面活动
2024-09-22 10:23:00
62度电就能跑536kM!小鹏M03实测续航达成率91.6%
快科技9月22日消息,近日,汽车之家对小鹏MONA M03进行了全面测试,而在续航测试方面,小鹏M03的表现十分突出,实测续航达成率91
2024-09-22 10:26:00
里程碑突破!全球首个真空噪声芯片:北京中科国光量子发布
快科技9月22日消息,北京中科国光量子科技有限公司近日宣布,成功研发出全球首个能有效抵御电源纹波攻击等侧信道攻击的随机数芯片
2024-09-22 10:26:00
秋天的第一份暖意!意尔康“金秋助学”爱心助梦想!
爱在金秋,筑梦起航。9月20日,2024年意尔康金秋助学奖学金发放仪式在总部青田举行,来自研发、生产、电商等中心的113位员工代替子女领取了公司发放的助学金
2024-09-22 10:45:00
天津北方网讯:日前,泰达新质生产力路演中心正式揭牌,其6个专委会同期成立。聚焦未来产业、新兴产业,泰达新质生产力路演中心将汇聚要素资源与项目资源
2024-09-22 10:48:00
595元!Redmi Note 14 Pro系列金刚保障服务曝光:含进水保、碎屏保
快科技9月22日消息,Redmi Note 14 Pro系列的“金刚保障”服务近期在京东平台曝光,售价595元,包含五项保障权益
2024-09-22 10:56:00