• 我的订阅
  • 头条热搜
...自:西宁晚报在互联网平台上,针对各类商品的“第三方评测”十分常见。评测机构和博主通过测试相关产品,并就质量、价格、服务等方面作出排行,为消费者提供购物参考。记者调查发现,评测机构所使用的检测方法和标准...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...4B和6B两个版本。据HuggingFace英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”。零一万物创始人及CEO李开复博士表示:“零一万物坚定进军全...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...界开源模型Llama3.1-405B、Mixtral-8x22B等相比,在多学科综合评测集、中英文NLP任务、代码、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基...……更多
中国移动5g手机综合评测结果公布
中国移动近日公布了2023年度5G手机综合评测结果,32款热门机型接受了从通信能力到用户口碑的全方位考核,小米和荣耀分别在高端和中端市场夺得冠军,展现了国产手机的强大实力。5G手机测评体系,用户体验为先中国移动的5...……更多
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
《科创板日报》5月31日讯(记者 朱凌)直至五月尾声,AI应用市场的火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,腾讯混...……更多
自带副驾屏的腾势N7,座舱智能化体验如何?
...其智能化体验有着不小期待。本期咱们借CC-1000T智能座舱评测体系,看看自带副驾屏的腾势N7,会带来怎样的座舱智能化体验。一、什么是CC-1000T智能座舱评价体系CC-1000T是车云研究院与合作伙伴从消费者体验角度出发,共同研发...……更多
新增电动车、新能源车跑分,2022鲁大师“牛角尖”榜单前瞻
...厂商最优秀最顶尖的产品的奖项。依据鲁大师专业大数据评测,为硬件品牌颁发最优秀最顶尖奖项。2022“牛角尖”增设了哪些奖项?据相关人士透露,2022年鲁大师“牛角尖”颁奖颁奖盛典相较往届,在手机领域增加了不少细分...……更多
全球AI安全评估测试有了新基准
...案“蚁天鉴”,用于人工智能生成内容的安全性和真实性评测、大模型智能化风控、可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”人工智能安全检测体系的应用实践,与全球生态伙伴交流编制...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...n4-Air用到的高质量通用训练数据和训练技巧,都在里面!评测结果显示,在使用百川智能优质通用训练数据与企业专有数据混合微调后,模型在金融、教育、医疗等场景下的专业细分任务的平均可用率高达96%。相比不混合通用数...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和...……更多
安兔兔评测PC版正式发布:电脑强不强 不服跑个分
快科技9月12日消息,安兔兔宣布,全新的安兔兔评测PC版已经正式发布。与Android版本测试流程相似,安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy(内存和存储)和UX(用户体验)四大项,通过模拟多种复杂场景最终得到电...……更多
...能交互量表,能有效地改善传统单一量表、一对一访谈等评测方法存在的人力成本高、周期跨度长、环境干扰大、标准不统一、结果不真实的弊端。”蒋贻顺说,为了提高产品的准确性,前期经过多次分析论证,之后还征集志愿...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来 产业智能跃迁”2023大模型产业前沿论坛上,中关村科金正式发布了国内首个企业知识大模型、AgentGraph应用开发平台...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...源模型文本长度最长的。360表示,他们在OpenCompass的主流评测数据集上验证了模型性能,包括C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA,考察的能力包括自然语言理解、知识、数学计算和推……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 TeleChat 系列模型提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方...……更多
...1.5-72)。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电信人工智能研...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...中,进行开放式生成,推理过程以及各种新兴 NLP 任务的评测。 (2)对齐:对齐技术通常需要大量人工标注的成对偏好数据来训练奖励或者策略模型,通过引入 LLM-as-a-judge 技术,采用更大的模型或者策略模型本身作为评估者,...……更多
万元内的高性价比专业卡——AMD Radeon Pro W7700显卡简评
...MCD的方案,和桌面RX 7900系列产品完全一致。而我们今天评测的Radeon Pro W7700则在核心的配置上基本与消费级桌面版的Radeon RX 7700相仿。 ▲AMD Radeon Pro 7000系全家福,Radeon Pro W7700是面向中高端专业应用市场的显卡产品。在……更多
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...置。论文还在 UCF-101 和 MSR-VTT Benchmark 上进行了 Zero-shot 的评测,在衡量生成视频丰富性的 IS 指标和文本一致性的 CLIPSIM 指标均取得了 SOTA 结果。 此外,论文还基于 FancyVideo 模型的 T2V 和 I2V 能力分别和前人方法……更多
从网站流量指标开始,CSDN 如何洞察运营效果异动?丨评测来了
...用业务的视角看待公司的运营。快速上手 kyligence ZenCSDN 评测产品四大能力关于具体评测过程,您可搜索『CSDN』视频号查看本场直播回放,以下内容是测评过程中的精彩对谈:Kyligence Zen 产品架构图Kyligence Zen 提供集业务模型、 ...……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
麦芒30评测:大模型赋能,一键解锁AI能体验
...运算,智慧生活等等,新功能品目繁多,欣欣向荣。今天评测的产品,便是麦芒品牌的首款AI手机,一句话总结它的产品亮点:麦芒30内置搭载星辰大模型,拥有“6100mAh高密度海量大电池、轻薄耐摔机身、1.5K双曲臻彩屏,以及AI...……更多
联想小新Pro14 AI超能本2024 评测:创作和娱乐全能
...,我们就为大家带来一款AI PC:联想小新Pro14 AI超能本的评测体验。作为一款针对年轻用户群体设计的笔记本,联想小新Pro14 AI超能本2024在外观设计上保持了小新系列的简约时尚风格,轻薄便携的机身使得它成为移动办公和学习...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...测试,旨在通过明确的任务模糊性判断和用户意图理解来评测智能体的交互能力。IN3 基准数据的构造过程如上图所示,基于人类编写的种子任务为 Step 1,模型迭代生成新任务以增强数据集,同时从数据集中采样以作为下一轮生...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...至比他们更严重,非常类似。GLM-130B唯一来自亚洲被列入评测的对象张鹏说,2022年我们在训练自己的千亿模型的时候,我们的研发团队、我们的算法工程师甚至是7*24小时的盯着我们的GPU集群,凌晨三点多的故障,我们可以在5分...……更多
速度是友商22倍!华为AI存储斩获中国最权威测试第一
...储测试中综合能力第一。据了解,CCF Storage Evaluation存储评测工作由清华大学、中山大学、之江实验室等顶尖大学和学术机构专家组成的CCF信息存储技术专委会存储测试工作委员会发起。它也是目前中国最权威、最专业的AI/LLM的...……更多
宾利穆莱纳bacalar和欧陆gtspeed模型发布
...球限量12辆,概念车在宾利百年华诞时亮相。 易车超级评测体系重磅发布,为用户带来当前市场中热门畅销新车的全方位实用评测,彻底解决你的选车、购车、用车疑惑。 ……更多
2022-12-21 19:38穆莱,宾利,欧陆,模型
云从科技:大模型五虎与AI智能体的领航者
...,加速了产业升级和数字化转型的步伐。 此外,在综合评测权威平台OpenCompass公布的评测结果显示,云从科技的从容大模型在该体系中的平均得分为65.5,这一成绩使得从容大模型跻身全球前三,超越了谷歌的Gemini-1.5-Pro和GPT-4v...……更多
阿里巴巴“AI驱动”战略提速 夸克发布自研大模型
...内容生成等技术优势,夸克大模型在CMMLU权威榜单的最新评测结果中,取得优异成绩。同时,夸克大模型具备了对不良、虚假信息识别、回答和指引的出色能力。知识能力方面,夸克大模型拥有广泛的知识覆盖、上下文理解、创...……更多
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...强调发展和评估认知大模型能力,首先必须有科学系统的评测体系。第二我非常赞同刚刚韦总提到的实践是检验真理的唯一标准。仅凭几个问题测试就评价大模型的能力并不科学,如何让大家全面了解大模型的能力以及实际应用...……更多
更多关于科技的资讯:
93.7分强势登顶!长城魏牌蓝山荣膺年度最佳中大型新能源六座SUV
快科技12月5日消息,在中汽测评最新的《CCRT选车指南》中,长城魏牌新蓝在14款高品质SUV中脱颖而出。以93.7的最高分成功登顶中型及大型新能源SUV推荐榜榜首
2024-12-05 19:39:00
卡德罗夫承认获赠特斯拉赛博皮卡是开玩笑:向马斯克致歉
今年8月,俄罗斯车臣共和国领导人卡德罗夫发布了一段他驾驶特斯拉Cybertruck赛博皮卡视频,称是从马斯克那里收到了这辆汽车
2024-12-05 19:39:00
唐尚珺称找对象太难:希望能遇见真爱
12月5日消息,据媒体报道,参加高考16次的唐尚珺接受媒体采访,他表示,有女生私信要联系方式,母亲也在催婚,但人生大事不能强求
2024-12-05 19:39:00
手感绝佳小直屏!华为Mate 70曜石黑图赏
快科技12月5日消息,华为日前发布了Mate 70系列,余承东称其为史上最强Mate。现在华为Mate 70已经来到我们评测室
2024-12-05 19:39:00
99元起 雷神新款三模游戏鼠标ML7上市:原相PAW3311、600毫安时电池
快科技12月5日消息,雷神新款三模游戏鼠标ML7目前已经上架开售,首发99元起。据悉,新款鼠标搭载原相PAW3311传感器
2024-12-05 19:39:00
发生了什么事!马斯克突然下令停产特斯拉赛博皮卡
马斯克怎么想的?让粉丝苦等4年的特斯拉明星Cybertruck,去年11月底正式交付前,攒下200万辆预订单。面对泼天的热情
2024-12-05 19:39:00
母婴互联网第一股宝宝树将退市!创始人因员工周末不响应工作怒退群
快科技12月5日消息,母婴互联网第一股宝宝树集团发布公告称,根据港交所公告,公司的上市地位将于12月9日上午9时起取消
2024-12-05 19:39:00
钓鱼马甲变成廉航神器!年轻人坐廉价航空把10kg行李穿在身上
快科技12月5日消息,据报道,这两年,一款专门为钓鱼爱好者设计的马甲火了,因为口袋多还大,特别能装,成为了年轻人出门的神器
2024-12-05 19:39:00
Ultra 9 285K+4090D售价31999元!机械师发布曙光水冷电竞主机新品
快科技12月5日消息,今天,机械师官方宣布正式推出曙光水冷电竞主机新品,共有两个规格,具体价格为:酷睿Ultra 9 285K处理器+RTX 4090D显卡+64G内存+2T S
2024-12-05 20:09:00
比燃油版更尊更霸气!路虎揽胜纯电版最新实车曝光
快科技12月5日消息,日前,路虎官方发布了全新纯电揽胜在高温测试中的实车照片,预计该车型将于2025年正式上市。在外观设计上
2024-12-05 20:09:00
蓝戟首秀半高刀卡Intel A770:可惜一般人买不到
快科技12月5日消息,蓝戟的锐炫B580发布会上,除了展示新卡,蓝戟还秀出了自己四年来的发展经历,以及一些不太常见的行业类产品
2024-12-05 20:09:00
为什么羽绒服里面穿短袖更暖和:里面穿的越薄导热越好
12月5日消息,微博话题“为什么羽绒服里面穿短袖更暖和”引发关注。据媒体报道,一到冬天,羽绒服就成了大多数人的出行标配
2024-12-05 20:09:00
江南时报讯 近日,泗洪农商银行举办了2024年业务技能考核活动。本次考核旨在激发员工学习热情,提升业务技能水平,为广大客户提供更优质
2024-12-05 20:13:00
《无限暖暖》IGN 9分!一款完美的少女游戏 虽然绕不开抽卡
由叠纸游戏开发的开放世界换装冒险游戏《无限暖暖》将于今日(12月5日)全球上线,本作的媒体评分也已经解禁。IGN给予本作9分的高分
2024-12-05 20:39:00
智慧农业“好物”来袭!中电科国海信通携新装备、新技术亮相冬交会
南海网12月5日消息(记者 任桐)“我们已经在海口琼山区6个荔枝种植基地,应用了智慧农业系统。你看,从这个系统,可以随时查看荔枝的种植情况……”12月5日
2024-12-05 21:34:00