• 我的订阅
  • 头条热搜
...沙利文联合头豹研究院发布《2023年中国大模型行研能力评测报告》。评测结果显示,商汤语言大模型“日日新·商量”以总分7.73(满分10分)斩获总榜第一,并在报告撰写能力、模型基础能力两个子榜位居第一。 ……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服务、应用部署...……更多
当国风遇上“太医管家” 中国太保为华服周带来健康新理念
...、血压健康评估、心脏健康评估、脑健康评估等4个健康评测服务,每个项目几分钟就能完成,并能即时出具综合健康评估报告,如有疑问,还可咨询线上医生解读报告,非常便捷。其中,智能中医脉诊通过大数据、人工智能、...……更多
多家车企质疑懂车帝冬测,中汽协呼吁汽车评测应专业公正
...体而言,此次懂车帝冬测引发广泛质或将成为第三方汽车评测领域的转折点,众多网友纷纷呼吁尽快出台真正科学、专业、严谨、公正的测试标准,为行业发展和用户购车用车带来真正的价值。 ……更多
腾讯混元文生图大模型升级并对外开源
...配置要求据此前报道,国内首个官方“大模型标准符合性评测”结果公布,腾讯混元大模型、成为首批通过评测的国产大模型,首批通过的大模型还有阿里通义千问、360智脑和百度文心一言。 ……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...5T基础平台软件产品兼容国内主流芯片。一、混元Turbo之评测混元Turbo的核心技术混元Turbo的发布凝聚了腾讯团队长期以来对大模型技术的深入研究。该模型采用全新的分层异构MoE架构,创新之处在于通过合理配置专家数量与激活...……更多
华为WATCH 4 Pro星球系列手表评测
华为WATCH数字系列一直以来都是全能旗舰选手,独特的美学设计、领先的健康功能、完备强大的鸿蒙体验,数字系列将美学和科技相结合,每一款产品都在不断突破。2021年的华为WATCH3系列是华为首款搭载HarmonyOS的智能手表,为...……更多
小米14 Pro成4000元以上高端旗舰机型第一
1月17日消息,今日,中国移动发布2023年年度综合手机评测数据结果,小米14Pro成4000元以上高端旗舰机型第一,对此雷军发微博称,祝贺小米14研发团队。其中,该评测选取了“2022年11月至2023年12月”的32款热门机型,覆盖4个价...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
...问答能力还存在一定差距。而在测试模型接近人的程度的评测榜单MT-Bench上,MiniCPM-2B的表现超过了Llama 2-70B-Chat。MiniCPM-2B和Mistral-7B在主流评测集上的测评结果。图源:面壁智能MiniCPM-2B和主流模型在MT-Bench上的测评结果。图源:……更多
...展论坛上,发布了“2023年度全国重点区域移动网络质量评测现场路测结果”,其中成都网络质量综合情况综合得分排名第四。据悉,本次评测范围涵盖全国102个城市,共有300多家运营商参与专项评测,测试场景包括城区快速路...……更多
汽车之家《新能源突破计划》锚定新能源车安全测试新基准
...拆解消费者对新能源车的需求和痛点,站在用户角度进行评测,以实车对撞、拆解分析、电池包浸水、智能辅助驾驶实际道路测试等实用测试科目,解答用户最关心的新能源用车疑问,强化用户对新能源安全的认知。而专业的测...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...智能“星火”生态。一、提出通用人工智能七大维度481项评测体系赶超GPT要有科学的方法和体系自去年11月30日ChatGPT发布以来,认知大模型技术阶跃持续进化,人工智能在全球引起了广泛关注,掀起了全新的热潮。在多个领域,...……更多
传音发布国际标准itu-tsg16全会结项评审
...流程和元数据、图像增强技术、双摄协同技术、图像美学评测等方向的标准构建,传音将联合产业链上下游及行业专家建设实现计算摄影领域国际标准的全方位布局。▲传音TecnoPhantomX2旗舰手机IT之家从官方公告获悉,传音围绕...……更多
十一部门联合开展“信号升格”专项行动
...,缩短审批时间。 (四)推动“能力升格”,促进监测评测水平提升1.完善网络质量评测体系和监测能力。中国通信标准化协会加快开展面向应用的端到端网络质量评测标准体系研制。中国信息通信研究院持续完善全国移动网...……更多
医疗大模型激战正酣,京东健康锋芒再露
...逐大赛也在升级。日前,面向中文医疗大语言模型的开放评测平台MedBench更新评测榜单,京东健康旗下“京医千询”大模型以综合得分92.4分的成绩位居榜单第一。“全面的模型能力评估体系会告诉我们团队,‘京医千询’的智能...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...快速追赶并努力超越的过程中,首先需要一套科学系统的评测体系。为此科大讯飞和中国科技大学共同承建的认知智能全国重点实验室,牵头设计了通用认知大模型的评测体系,涵盖前述七大维度,涉及481个细分任务类型。刘庆...……更多
ColorOS 14评测:让用户更省心的智慧手机系统
在旗舰手机处理器性能普遍过剩的今天,一款手机的日常体验如何更多地是由系统体验决定的,因此手机系统的体验升级也已经成为了当下用户与手机厂商所共同关心的焦点。在众多的手机系统当中,OPPO手机所搭载的ColorOS系统...……更多
忆恒创源PBlaze7 7946 6.4TB评测
...0又分为1DWPD的PBlaze77940和3DWPD的PBlaze77946两个子系列,本文评测的正是后者,形态U.2,容量6.4TB。作为应用PCIe5.0接口的全新一代SSD,性能无疑是我们最为关注的看点。根据忆恒创源官方介绍,PBlaze77940拥有14GB/s的顺序读取速度和10G……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...视角视频,时长在20到120分钟之间,涉及77种日常活动。评测结果表示,人类专家水平显著优于目前长上下文多模态模型中最厉害的Gemini Pro 1.5(85.0%对37.3%)。在多模态能力上,大模型们还任重而道远。HourVideo如何炼成? 之所以...……更多
...长一段时间内国内印刷企业并没掌握数字化印刷色彩质量评测技术。“这项技术能够解决印刷色彩一致性的问题,但价格高昂的色彩质量评测系统让许多中小型印刷企业望而却步。这些企业只能依赖‘人眼校色’,印样与样稿能...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...对6个包括百融云创大模型、ChatGPT3.5在内的大模型进行了评测。在测试中一共设置了600个问题,其中300个IDK(没有正确答案的问题),300个非IDK问题(有正确答案的问题),百融云创大模型在回答非IDK问题时准确率达到67.7%左右...……更多
山海启航,云知声迈向AGI新征程
...多项全球通用任务上表现优异,还在医疗垂直领域的专业评测表现中实现了对GPT-4和Med-PaLM2的超越,标志着山海正式起航。通用模型能力持续演进,跻身行业前列2023年7月和8月,山海百亿及千亿级大模型在C-Eval全球大模型综合性...……更多
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
...,还真的有人试了。上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,同时邀请有高考评卷经验的教师...……更多
人工智能的偏见——基于全球大语言模型情商与智商偏见测试
...教授带领的来自中、美、法、越、加等国的AGI-AIGC-GPT 评测 DIKWP(全球)实验室发布了全球大语言模型(LLM)情商(EQ)与智商(IQ)偏见测试。该测试旨在评估和比较国内外大语言模型分别在“男性”和“女性”视角下的智商...……更多
中国AI大模型工业应用指数发布
...应用指数,针对大模型在民爆行业安全防控场景开展应用评测。总体上,国内大模型行业应用指数为84分,国际为93分,国外大模型仍具备领先优势;在场景细分能力上,国内大模型在人员行为监测、事故监测、危险车辆监测细...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...用视觉模型的开源社区建设,开源项目覆盖数据、模型、评测基准全链路,为学术界和产业界的多模态通用模型研发提供了坚实的支撑。在数据方面,OpenGVLab构建了千万级超大规模精标注数据集,涵盖了图像分类、目标检测等视...……更多
阿维塔11荣获IVISTA中国智能汽车指数五星智能评价
...秀)评价的车型。同时,阿维塔11还刷新了导航智能驾驶评测(NP测试)历史最高分,以96.10分拿下G+(极优秀)评价,斩获该排行榜第一名。阿维塔11荣获IVISTA中国智能汽车指数五星智能星级评价。 阿维塔科技供图 华龙网发中国...……更多
GPT-4就是冲着赚钱来的!
...I在发布GPT-4的同时,还公布了一项有意思的开源。即用于评测大语言模型的OpenAI Evals框架,该框架可以通过数据集自动生成提示(Prompt),评估模型生成的回答/补全(completion)的质量,比较不同数据集或模型的性能。“这类评...……更多
汽车之家《新能源超测》:推动共建以用户需求为导向的评测体系
...同时,汽车之家资讯中心负责人仝斐和汽车之家资讯中心评测内容部总监揣琢一同出席了活动。活动以《新能源超测》预告短片惊艳开场,正式揭开“全温区、真场景、多视角的新能源汽车全球挑战之旅”的神秘面纱。汽车之家...……更多
...“晋心守未”行动计划面向在校师生进行心理健康筛查与评测,建立适合中小学特点的人工智能和大数据心理健康测评体系,形成科学严谨的分析数据、干预措施以及完备的心理健康管理档案,为后续师生身心健康保障工作提供...……更多
更多关于科技的资讯:
挖呀挖黄老师疑开豪车引热议:有网友认为条件允许 开豪车正常
12月5日消息,据媒体报道,因“挖呀挖”走红的黄老师发布31岁生日转场视频,视频中黄老师开的车因疑似“迈巴赫”“改装奔驰V260”引发热议
2024-12-05 22:10:00
汤臣倍健与中国科学家合力攻坚全新的代谢健康评估体系,取得开拓性成果
近日,汤臣倍健与中国科学院上海营养与健康研究所、中国科学院分子细胞科学卓越创新中心合作开展的“内稳态健康评估体系”研究成果
2024-12-05 22:18:00
本文转自:人民日报客户端12月5日,在国家市场监督管理总局和中国消费者协会倡议指导下,抖音等互联网平台企业、无忧传媒等网络直播营销人员服务机构(MCN机构)和老爸评测等从事第三方
2024-12-05 22:19:00
本文转自:人民网-江苏频道“我们探索数字技术与钢铁业务深度融合,重塑生产运营模式。经过智能化改造的热轧1422产线以‘智能化+大数据应用’为驱动
2024-12-05 22:37:00
荣耀200系列/Magic Vs2/Magic4系列开启MagicOS 9.0公测
快科技12月5日消息,今天荣耀宣布,荣耀Magic Vs2、荣耀Magic4系列、荣耀200系列开启MagicOS 9
2024-12-05 22:40:00
国行版iPhone 16终于要升级AI了:曝苹果将与百度合作
根据The Information报道,苹果和百度的工程师正在竞相改进百度的大型语言模型,以便它们能够更好地为iPhone用户服务
2024-12-05 22:40:00
李冰冰51岁状态上热搜:网友感慨时间过好快 还是这么美
12月5日消息,李冰冰一直以其独特的魅力和专业的演技赢得了观众的喜爱。如今,已经51岁的她,依旧保持着良好的状态,散发着一种成熟女性的韵味
2024-12-05 23:10:00
潘通2025年度代表色摩卡慕斯发布!联想moto razr 50 Ultra限定版要用
快科技12月5日消息,今晚,世界色彩研究机构Pantone潘通正式发布2025年度代表色:PANTONE 17-1230 Mocha Mousse (摩卡慕斯)
2024-12-05 23:10:00
93.7分强势登顶!长城魏牌蓝山荣膺年度最佳中大型新能源六座SUV
快科技12月5日消息,在中汽测评最新的《CCRT选车指南》中,长城魏牌新蓝在14款高品质SUV中脱颖而出。以93.7的最高分成功登顶中型及大型新能源SUV推荐榜榜首
2024-12-05 19:39:00
卡德罗夫承认获赠特斯拉赛博皮卡是开玩笑:向马斯克致歉
今年8月,俄罗斯车臣共和国领导人卡德罗夫发布了一段他驾驶特斯拉Cybertruck赛博皮卡视频,称是从马斯克那里收到了这辆汽车
2024-12-05 19:39:00
唐尚珺称找对象太难:希望能遇见真爱
12月5日消息,据媒体报道,参加高考16次的唐尚珺接受媒体采访,他表示,有女生私信要联系方式,母亲也在催婚,但人生大事不能强求
2024-12-05 19:39:00
手感绝佳小直屏!华为Mate 70曜石黑图赏
快科技12月5日消息,华为日前发布了Mate 70系列,余承东称其为史上最强Mate。现在华为Mate 70已经来到我们评测室
2024-12-05 19:39:00
99元起 雷神新款三模游戏鼠标ML7上市:原相PAW3311、600毫安时电池
快科技12月5日消息,雷神新款三模游戏鼠标ML7目前已经上架开售,首发99元起。据悉,新款鼠标搭载原相PAW3311传感器
2024-12-05 19:39:00
发生了什么事!马斯克突然下令停产特斯拉赛博皮卡
马斯克怎么想的?让粉丝苦等4年的特斯拉明星Cybertruck,去年11月底正式交付前,攒下200万辆预订单。面对泼天的热情
2024-12-05 19:39:00
母婴互联网第一股宝宝树将退市!创始人因员工周末不响应工作怒退群
快科技12月5日消息,母婴互联网第一股宝宝树集团发布公告称,根据港交所公告,公司的上市地位将于12月9日上午9时起取消
2024-12-05 19:39:00