• 我的订阅
  • 头条热搜
...海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、字节跳动豆包、书生·浦语等20款国产大模型出战,角逐中国大模型“最强...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
(id:SouthReviews)原标题 | 他们抄袭,作弊,做假,却宣称超越作者 | 南风窗记者 朱秋雨编辑 | 向由排版 | 菲菲AI大模型大战在2023年爆发后,AI创业者不免感到有些心灰意冷——不管自己的团队如何加班加点,好让产品迭代面世...……更多
智源评测体系发布 国内外“百模”评估结果出炉
5月17日,智源研究院举办大模型评测发布会,正式推出智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理...……更多
字节扣子模型广场,给AI大模型搭了一座擂台
...移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...最强大模型。历经一年多追赶,国产大模型终于进入核心竞技场,可与国外一流大模型一较高下。奋力追赶一年,成就最强中文大模型大模型技术爆发一年多,行业竞争态势激烈而又多变。通义千问走了一条最“卷”的路,2023...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...人工智能实验室(GAIR Lab)推出的OlympicArena[1] (奥林匹克竞技场)满足了这个需求。奥林匹克学科竞赛不仅是对人类(碳基智能)思维敏捷性、知识掌握和逻辑推理的极限挑战,更是AI(“硅基智能”)锻炼的绝佳练兵场,是衡...……更多
国内首个官方“大模型标准符合性评测”公布
...委员会人工智能分委会全体会议期间,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、阿里通义千问等大模型成为首批通过评测的四款国产大模型的其中之二。据介绍,“大模型标准符合性评测”由中国电...……更多
AI大模型“国标”首批测试结果公布,人工智能成市场新焦点
12月22日,国内首个官方“大模型标准符合性评测”结果公布,百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。测试结果称,上述四款模型符合《人工智能大规模预训练模型第2部分:评...……更多
...报记者 赵广立2024年全国高考的“硝烟”刚刚散去,“大模型考生”就被抓回来重新“做题”了。市面上涌现出的大模型产品让人眼花缭乱,围绕“大模型技术哪家强”的讨论不绝于耳,各色名目的大模型评测应运而生。作为国...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...机器之心编辑部在 OpenAI 发布会的前一天,来自中国的大模型公司零一万物,让开源大模型社区活跃了起来:Yi 大模型家族新成员「Yi-1.5」模型正式开源。在项目主页可以看到,Yi-1.5 包括一系列预训练和微调模型,分为 6B、9B、3...……更多
本文转自:新华每日电讯“百模大战”以来,AI大模型的部分榜单上出现了一个奇怪现象:长期盘踞在榜单前列的,经常是一些名不见经传的国产大模型,它们竟然以接近满分的优势碾压了ChatGPT、Gemini和其他知名的AI大模型。之...……更多
王者荣耀:国际版开测三天,预约人数激增,安卓用户终于可以登录
...究此前,很多玩家都以为《ArenaofValor》(中文译名:勇士竞技场),是王者荣耀的国际版。事实上,《ArenaofValor》这款游戏,是新加坡Garena游戏公司,和腾讯天美工作室共同开发,主要发行在欧美地区的一款Moba游戏。发行在港澳台...……更多
...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
1月30日,上海人工智能实验室发布了大模型开源开放评测体系司南(OpenCompass 2.0),同时揭晓了2023年度大模型公开评测榜单,GPT-4 Turbo在各项评测中均获最佳表现,智谱AI新一代基座大模型GLM-4紧随其后,排名第二。上海人工智...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...12日消息,360公司日前在GitHub上开源了360智脑7B(70亿参数模型)。360智脑大模型采用3.4万亿Tokens的语料库训练,以中文、英文、代码为主,开放4K、32K、360K三种不同文本长度。360表示,360K(约50万字)是当前国产开源模型文本长...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单,...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...至还能与其两倍大的模型竞争。目前Gemma 2已入驻大模型竞技场(LMSYS Chatbot Arena),Gemma 2 27B排名与Llama3 70B相当:而Gemma 2 9B的排名甚至比肩Qwen 2 72B:该结果也让网友纷纷表示难以置信。 此外,VentureBeat表示,两种……更多
中国信通院发布大模型安全基准测试报告 360智脑综合排名第一
...本文转自:中国新闻网近日,中国信息通信研究院发布大模型安全基准测试AI Safety Bench 2024年Q1的首轮测评报告(下称“测评报告”),结果显示,三六零集团自研的认知通用大模型360智脑综合排名第一。大模型安全基准测试AI Safety...……更多
openaigpt-4o登顶竞技场排行榜
...工WilliamFedus周一在社交平台X证实,近期在LMSYS聊天机器人竞技场(ChatbotArena)上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型GPT-4o。Fedus还透露,GPT-4o在测试中登顶了竞技场排行榜,取得了有史以...……更多
看完讯飞星火发布会后,我看到了国产大模型的未来
...汤日日新、阿里通义千问、京东灵犀、昆仑万维天工等大模型先后登场,让国内已发布的大模型数量达到了惊人的30余个。掀起新技术浪潮的AI大模型,已经成为各家科技公司必须参加的一场大考。身为“人工智能国家队”的科...……更多
AI大模型参加高考 GPT-4o文科成绩最好 理科普遍不行
...媒体近日举办了一项“另类高考”,让近两年大火的AI大模型来模拟考生作答高考试题,看它们的表现究竟如何。从该媒体公布的最新发布高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳...……更多
国产ai大模型首批评估名单公布
6月11日消息,中国信息通信研究院公布了可信AI代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱codegeex等国产AI大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求第1部分:代码...……更多
本文转自:法治日报随着人工智能技术的迅猛发展,大模型在各个领域的应用日益广泛。为全力筑牢人工智能安全防线,进一步提高大模型技术的安全风险防范能力,今年2月,中国信息通信研究院(以下简称中国信通院)联合3...……更多
国产低价显卡坞评测:能让轻薄本用上本地大模型
...情况,需要AMD的驱动进一步完善。轻薄本也能玩转本地大模型 接下来老规矩,现在怎么说也算是AI大模型的应用期,这有张显卡不拿去跑大模型,就跟矿潮的时候买了张显卡却没试过挖矿一样,那肯定就是不行的。不过,目前...……更多
东方财富董事长其实:建议进一步推动股权投资支持科技创新
...推动股权投资支持科技创新的建议》和《关于支持垂直大模型开发与应用的建议》。推动股权投资支持科技创新方面,其实提出了三方面建议:一是进一步健全政府引导基金容错机制,二是支持链主企业开展早期风险投资,三是...……更多
腾讯混元文生图大模型升级并对外开源
5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲混元长文生图效果升...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...据集上的表现甚至胜于GPT-4V,成为了开源模型中的“性能王者“。图片来源:LLaVA-1.6官网的标准评测数据在不拘泥于单一模态的内容生成,具有Text-to-Text和Image-to-Text两种模式的同时,LLaVa-1.6的过人之处还在于更低的训练数据成...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
月狐数据发布中国市场首份《AIGC应用app智能化评测报告》
近年来,国内AI大模型行业蓬勃发展,市场上AIGC产品如雨后春笋般涌现,产品功能、体验和玩法日趋丰富,同时用户对于AIGC产品的使用兴趣度不断提升,生成式AI普及范围持续扩大,截止2023年12月,生成式AI移动应用全网安装渗...……更多
更多关于科技的资讯:
□沈柳晨您的浏览器不支持 video 标签。近期,多地公安机关发布了多起利用AI工具实施造谣的相关案件,如发布“西安突发爆炸”虚假新闻的账号所属机构
2024-07-24 12:29:00
身份拉满!新款奔驰S级曝光:全身17个三叉星辉
快科技7月24日消息,最近,网上曝光了一组全新奔驰S级的测试谍照。虽然从整体造型上看,新款车型与现款车型相比并没有太大变化
2024-07-24 12:56:00
库克收大礼!印度又为苹果每年节省至高5000万美元:加大印产iPhone比例
快科技7月24日消息,据国外媒体报道称,苹果近日又收到了印度送来的大礼,在当地他们每年将节省至高5000万美元。印度宣布
2024-07-24 13:26:00
小米汽车销售自曝单月提成6万元:栓条哈士奇都能卖车
7月24日消息,作为小米汽车的首款车型,小米SU7热度极高,目前单月交付量稳定过万。近日,有小米汽车销售接受了相关媒体采访
2024-07-24 13:26:00
测评漫步者Comfo Fit II开放式蓝牙耳机质量怎么样?
原标题:入手感受漫步者ComfoFitII开放式蓝牙耳机质量怎么样?优缺点测评揭秘!漫步者ComfoFitII开放式蓝牙耳机质量怎么样
2024-07-24 13:48:00
波音飞船还能支棱起来吗,俄专家:难修复,已歇菜
波音公司的星际客机到底怎么回事?到底还能不能回来?现在,波音飞船引起国际社会的广泛关注,尤其是同行持续关注,但有些同行的关注是希望看笑话
2024-07-24 14:42:00
地球上的水是哪来的?用了46亿年,水有没有变少?
世界上的一切生命都离不开水的滋润,无论是陆地上的植物、动物,还是海洋里的生物,甚至人类的身体 水,都离不开水的参与。那么地球上的水又是从哪里来的呢?经过了数十亿年时间
2024-07-24 14:42:00
我国发现月球“水库”,为何美国登月那么多次,却丝毫没有发现?
NASA(美国宇航局)的月球大气与尘埃环境探测任务曾推测,月球空间中的水分子会因为流星雨撞击月面而逃逸到宇宙中,他们认为月表10厘米到3米区域可能存在未被发现的储水层
2024-07-24 14:43:00
月球背后的“秘密”被揭开?中国卫星传回图像,其实霍金讲得对
月球背后的“秘密”被揭开?中国卫星传回图像,其实霍金讲得对在古代的一个宁静村庄,有一位年迈的老人,村里的居民都称他为“老李”
2024-07-24 14:43:00
聚焦人工智能 2024年湖北人才周在鄂州启幕
中新网湖北新闻7月23日电(吕泳庆)以“人才引领,AI赋能”为主题的2024年“湖北人才周”暨“7·22鄂州人才周”活动22日在鄂州国际会展中心启幕
2024-07-24 14:44:00
全面透视豆包:功能、版本、价格、优势、应用
本文将深入探讨豆包的功能特点、应用场景、费用结构以及企业应用优势和注意事项,帮助读者全面了解并合理利用这一AI工具,提升个人和企业的效率与竞争力
2024-07-24 14:44:00
警告:一艘被AI控制的飞船越过月球轨道,闯入星际航线
一个不一样的月球。左半部是月球的背面,右半部是月球的正面。由伽利略探测器拍摄。NASA / JPL对人工智能的不了解,让我们产生了各种各样奇怪的想法
2024-07-24 14:45:00
凉凉!网红大哥远无限期封禁、空空日记掉粉丝200余万
近期,拥有700万粉丝的网红“大哥远”在其直播中不当调侃狼牙山五壮士,此举在网络上引发轩然大波,众多网友指责其将无知当作娱乐效果
2024-07-24 16:29:00
萤石发布首款智能健康手表WA1S:接入萤石蓝海大模型 可控制家居
快科技7月24日消息,萤石今天召开了“智动新生,尽在掌控”2024萤石夏季新品发布会,推出了多款重磅新品,其中就包括首款智能穿戴设备——萤石智能健康手表WA1S
2024-07-24 13:56:00
仅巴掌大小!龙芯2K0300蜂鸟开发板图赏
快科技7月24日消息,日前龙芯中科发布了龙芯2K0300蜂鸟开发系统,可以让嵌入式工程师快速、自如地做出有竞争力的产品
2024-07-24 13:56:00