• 我的订阅
  • 头条热搜
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...对6个包括百融云创大模型、ChatGPT3.5在内的大模型进行了评测。在测试中一共设置了600个问题,其中300个IDK(没有正确答案的问题),300个非IDK问题(有正确答案的问题),百融云创大模型在回答非IDK问题时准确率达到67.7%左右...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
...,还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,同时邀请有高考评卷经验的教师...……更多
山海启航,云知声迈向AGI新征程
...多项全球通用任务上表现优异,还在医疗垂直领域的专业评测表现中实现了对GPT-4和Med-PaLM2的超越,标志着山海正式起航。通用模型能力持续演进,跻身行业前列2023年7月和8月,山海百亿及千亿级大模型在C-Eval全球大模型综合性...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...教授带领的来自中、美、法、越、加等国的AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商...……更多
汽车之家《新能源超测》:推动共建以用户需求为导向的评测体系
...同时,汽车之家资讯中心负责人仝斐和汽车之家资讯中心评测内容部总监揣琢一同出席了活动。活动以《新能源超测》预告短片惊艳开场,正式揭开“全温区、真场景、多视角的新能源汽车全球挑战之旅”的神秘面纱。汽车之家...……更多
酷睿i9-14900K首发评测:开箱即有6.0GHz
...ks、Creo等软件性能的测试,同样取得了非常不错的成绩。评测总结由于这次酷睿i9-14900K对比前代基本只是频率上的小幅提升,性能上的提升比较有限,并不像“13香”对比12代时那么大,这也符合我以及很多消费者的预期,但并...……更多
中国AI大模型工业应用指数发布
...应用指数,针对大模型在民爆行业安全防控场景开展应用评测。总体上,国内大模型行业应用指数为84分,国际为93分,国外大模型仍具备领先优势;在场景细分能力上,国内大模型在人员行为监测、事故监测、危险车辆监测细...……更多
...“晋心守未”行动计划面向在校师生进行心理健康筛查与评测,建立适合中小学特点的人工智能和大数据心理健康测评体系,形成科学严谨的分析数据、干预措施以及完备的心理健康管理档案,为后续师生身心健康保障工作提供...……更多
60岁老人平衡能力至关重要!如何评测与预防摔倒?医生:做好9点
评价老年人的平衡能力并采取相应的预防措施,可以有效降低老年人摔倒的风险。原因主要是很多老年人骨骼已经出现了疏松,很有可能在轻微外力下就导致骨折,这种情况我们称之为脆性骨折。即使是手腕的骨折,如果处理...……更多
“礼遇四川”四川特色伴手礼评测结果揭晓 50款伴手礼上榜
... (赵祖乐)9月26日,2024年“礼遇四川”四川特色伴手礼评测活动在成都落下帷幕。经过长达数月的精心筹备与激烈角逐,最终50款极具地域特色和文化底蕴的伴手礼脱颖而出,获评“2024年四川特色伴手礼”。此次评测活动自今...……更多
vivo S18 Pro评测:搭载天玑9200+芯片和蓝心大模型 打造同档最强人像
来源 / 江湖老刘当一款智能手机拥有了强悍的影像实力,此时定能吸引无数消费者的目光。近日,vivo正式推出了主打人像拍摄的vivo S18系列,包括vivo S18 Pro、S18以及S18e三款手机。众所周知,vivo S系列都以其年轻化和高颜值的特...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...性、严谨性、创新性和普遍性方面均优于基线模型。主观评测显示出 MLR-Copilot 生成的实验假设和设计更符合人类研究者的预期,较低的相似度也间接体现其创新性。 在实验实现和执行阶段,MLR-Copilot 能够显著提升任务性能,并...……更多
科大讯飞:打造自主创新的大模型底座,为全球产业链提供更多选择
...国企业发展研究中心最近发布的年度第三份关于大模型的评测报告——《人工智能大模型体验报告3.0》评测结果显示,由科大讯飞研发的讯飞星火认知大模型获得1775最高分蝉联冠军,并获得基础能力指数、智商指数、工具提效...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...数据集。作为千亿级基础大模型,“源2.0”在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,“源2.0”在多项模型评测中展示出了较为先进的能力表现。“源2.0”采用全面开源策略...……更多
速度制程技术全面升级!三星PRO Ultimate MicroSD卡评测
...的卡片进行全面的技术革新和性能提升。 今天来到我们评测室的就是三星刚刚推出不久的PRO Ultimate MicroSD卡,其中Ultimate译为“最终的、极限的”,从命名中我们不难看出,这是旗舰级的MicroSD卡,那么它究竟有着怎么样旗舰性...……更多
...应用”全栈技术能力建设,力争在新架构、新算法、性能评测以及基础软硬件支持等方面不断取得新突破。 打造发展新高地,形成数据驱动、人机协同、跨界融合、共创分享的智能经济形态。一方面,推动智能经济核心产业补...……更多
华为连续三年超越多个手机品牌获得五星评分
...截止今年,华为已连续三年超越多个手机品牌,获得凤凰评测"推荐视障用户使用的品牌"以及最高的五星评分。他表示,华为的HarmonyOS4操作系统,借助智能问答,助听器直连、长辈关怀、小艺通话等功能,解决了障碍用户和老年...……更多
申花一线队进行身体机能专业评测 今晚启程飞赴海口开启冬训
...体队员在上海UFC精英训练中心进行了全面的身体机能专业评测。测试内容涵盖了肩部运动测试、髋关节足跖屈等长力量评估、双能X射线吸收测试、平均糖酵解能力(临界功率)、最大摄氧量测试等多个项目。通过评测结合产生每位...……更多
...架、DataOps系列标准、“可信大数据&可信数据库”评估评测观察等重磅研究成果,积极促进大数据、数据资产管理相关理论在行业中落地实践,助力数字经济蓬勃发展。 ……更多
Jmoon极萌以科技驱动居家美容新风尚
...期流程均符合相关要求。除此之外,中国家用电器研究院评测中心评估报告显示:对“极萌”牌M12型熨斗美容仪进行了评测,评测结果为A级。中国家用电器研究院技术专家表示:极萌通过了在射频工作性能、微电流电压工作稳...……更多
可生成政治人物图像,马斯克旗下xAI发布Grok-2“手撕”OpenAI
...方面表现突出。在官方博客文章中,xAI公布了Grok-2的各项评测结果。大语言模型评测平台LMSYS将Grok-2的早期版本列为全球排名前五的聊天机器人模型,位列OpenAI的ChatGPT-4o、谷歌的Gemini 1.5 Pro之后。此外,Grok-2在多个推理、阅读理...……更多
...21日电 9月19日,2024年“礼遇四川”四川特色伴手礼线下评测活动在四川成都开启。在消费者的热切期盼中,经过层层筛选的90余家企业携其精心准备的100件精品伴手礼亮相评测现场,每一款都承载着四川独特的文化韵味与企业的...……更多
...护委员会了解到,陕西省2023年首届“三秦伴手礼”消费评测活动已于近日正式启动。据悉,本次消费评测活动最终结果将于2024年3月份发布。首届“三秦伴手礼”消费评测活动分为征集申报、初评筛选、网上评测、优选评测、宣...……更多
首发骁龙8 Gen 3领先版的AI游戏手机 红魔9S Pro评测
...也依然是行业中非常罕见的背部纯平的手机。而此次我们评测的是红魔9S Pro“氘锋透明暗夜”,此外还有“暗夜骑士”、“氘锋透明银翼”,以及之后还有一款神秘的白色特别款。红魔9S Pro的镜头模组放在了左上角,但一反行业...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...得了优势。同时,在斯坦福大模型排行榜 AlpacaEval 的英语评测中,Yi-Large 达到全球大模型 Win Rate 第一。在中文通用大模型综合性基准 SuperCLUE 的中文语言理解排名中,Yi-Large 一跃成为国产大模型 No. 1。中文能力方面,SuperCLUE 更...……更多
英特尔酷睿i9-14900KS评测
...率的新高度,令广大用户开机便可拥有超凡的性能。此次评测,笔者便揭晓这款旗舰CPU的强大表现。首先需要说明的是,从酷睿i9-13900K、酷睿i9-13900KS、酷睿i9-14900K,到现在的酷睿i9-14900KS,这4款CPU几乎可以看作是同一款产品,笔...……更多
英特尔至强W-3500处理器评测:科学计算与机器学习领域的黑马!
...t Systems对英特尔新推出的至强W-3500系列处理器进行了深入评测。评测结果显示,这款处理器在科学计算和机器学习方面展现出了不俗的实力。在标准化测试中,Puget Systems严格控制了内存速度和散热等变量,以确保测试结果的客...……更多
Wearfit OS智能手表值得入手吗?评测:功能全面,比想象中智能!
...,也就是说:火爆全网的Wearfit OS智能手表值得入手吗?评测结果:功能全面,比想象中智能!在全球AI浪潮的推动下,AI智能应用迅速增长,极大地改变了我们的生活和工作方式,智能穿戴设备作为未来可能替代智能手机的设备...……更多
小米14pro荣获4000元以上高端旗舰机型第一
...1月17日消息,近日,中国移动发布了2023年年度综合手机评测数据结果,小米14Pro凭借出色的表现,荣获4000元以上高端旗舰机型第一。雷军在微博上对小米14Pro研发团队表示祝贺,并肯定了他们在产品创新上的努力。这次评测覆盖...……更多
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
...布千亿参数Yi-Large闭源模型。他当时表示,Yi-Large的多项评测结果超越ChatGPT4。在一周前,OpenAI又推出了其最新模型GPT-4o,不仅性能有大幅提升,价格也下调了50%。国内市场,字节跳动、阿里等大厂纷纷大幅度降低大模型价格,百...……更多
更多关于科技的资讯:
聚焦服务品质 福州千名经纪人共赴贝壳福州站搏学大考
贝壳福州站搏学大考考场11月19日,贝壳找房福州站第26届新经纪品牌搏学大考正式拉开序幕,福州数千名房产经纪人通过线下机考的形式完成了本届搏学大考
2025-11-20 13:38:00
当输入一句简单指令,AI就能在几秒内给新鲜水果添上霉斑、给完好衣物制造破洞,这样的技术能力如今却成了少数人薅商家羊毛的利器
2025-11-20 11:16:00
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00