• 我的订阅
  • 头条热搜
全球几十种大模型评测,如何甄别可信度?
图片来自视觉中国蓝鲸新闻12月20日讯(记者 武静静)要衡量一个大模型能力是否够强,评测是最直接的维度。大模型评测就是为大模型的一场“考试”,从不同大模型的表现中,不仅可以衡量现有技术水平,还能帮助识别大模...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...求。那么,该如何确保大模型在应用落地过程中的安全和可信度呢?「大模型落地的最后一公里,需要一个系统化的方法论来保障大模型应用侧落地过程中的可信。」中国信息通信研究院人工智能研究所所长魏凯在论坛上强调。...……更多
AI潮起 共筑数智之基
...大模型无法胜任结构化数据处理的产业共性难题。在安全可信度方面,九天基础大模型是通过国家“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的首个央企研发大模型,并获得中国软件测评中心安全测评...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...,首次从多个维度和视角全面评估了主流多模态大模型的可信度,展示了其中多个潜在安全风险,启发多模态大模型的下一步发展。论文标题:Benchmarking Trustworthiness of Multimodal Large Language Models: A Comprehensive St……更多
...业自律公约,规范市场经营秩序,增强大模型的透明度和可信度,为大模型的发展培育健康肥沃的土壤。中关村科金技术副总裁张杰认为,知识大模型是企业引入大模型的最佳切入点,也是新时代下必需的新兴基础设施。在此次...……更多
外媒称Switch2真机爆料可信度高!油管惊现Switch2模型上手视频
不久以前一位名为NextHandheld的用户声称获得了一台零售版Switch 2主机,并确认其名称为“Nintendo Switch 2”,表示将会在圣诞节发布证据。外媒theverge发文,称自己已经和NextHandheld进行交谈,基本上可以确定他的话为真。“我看到...……更多
人工智能应用场景不断拓展
...业界的广泛沟通联动,用模型开源等方式提升其透明度与可信度。 ……更多
智慧芽发布AI助手“芽仔-生物医药”,大模型革新信息检索模式
...数据集保障了”芽仔-生物医药”为用户提供一站式、高可信度的数据查询与回答。评测结果显示,“智慧芽生物医药大模型”达到了通过中国执业药师职业资格考试、美国注册药剂师考试(NAPLEX)的水平,并在考试能力、机器...……更多
...可信方面,创新网络模型可信架构,增强模型可解释性和可信度;在可用方面,提供成熟可用的大模型行业落地方案、轻量化部署工具、原生应用框架和软硬一体智能平台,降低使用门槛。该产品可提供意图识别、多轮问答、知...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...试图操纵用户,以及为 AI决策提供解释性,增加透明度和可信度。OpenAI总裁Greg Brockman也提到,这提供了新的安全机会,公司正在积极探索,包括可靠性、幻觉和对抗攻击者的鲁棒性。“在权衡了用户体验、竞争优势、思维链监...……更多
科学家的当务之急提高AI系统可信度
...利分校教授迈克尔·乔丹:科学家的当务之急提高AI系统可信度俞陶然乔丹在演讲中展示的数学公式能提高人工智能系统的可信度。 ■在讨论人工智能的负面影响时,不必聚焦毁灭性风险,因为那属于科幻小说和电影。对科学家...……更多
...险的必要性,并强调了纠正现有气候模型偏差以增加预测可信度的重要性。(完)【编辑:管娜】 ……更多
...程构建安全专家思维链,并使用检索增强、知识图谱提升可信度和专业度,为用户提供具备可落地的安全检测、研判能力。另一方面,持续加强技术研究与创新,从构建可信任的安全智能生态出发,逐步构建“大模型+小模型”...……更多
外媒The Verge称已验证Switch 2真机:可信度很高
我们此前曾报道过Reddit论坛网友“NextHandheld”声称自己已经拿到Switch 2真机的新闻,现在外媒The Verge联系了网友“NextHandheld”,并对其所说的Switch 2真机进行了验证,最终得出结论:基本确定“NextHandheld”的泄露为真。据悉,The ..……更多
正式发布|绿盟AI大模型风险评估工具
... ★精准化基础能力评估,提升模型安全防御评估结果可信度 基于专业的阅读理解测试题数据集及各学科能力测试题数据集综合评估模型基础能力,检测模型自然语言理解能力,生成,指令跟随等能力,充分了解模型自身基...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...模型能不能在常识推理层面接近人类水平,是提高其自身可信度、增强决策能力、拓展多领域应用的重要指标之一。Skywork o1 Lite 和 Preview 在这点上都表现不错。比如长度(英寸、厘米、码)与质量单位(公斤)的区分。比如盐...……更多
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...”,包括建立威胁信息共享机制、开展AIGC真实内容来源可信工作、建立AI保险机制等。 一、成立半年近百家单位,形成安全、治理两大工作组AIIA安全治理委员会成立于2023年12月底,经过半年的运营,组织架构现有治理组、安全...……更多
...用,可能生成“编造”的内容,直接影响金融分析结果的可信度。一旦AI大模型产生不准确的结果,目前也很难分清到底是算法技术不可靠,还是提供的底层数据不可信,这就使责任难以明确,可能造成金融业不同部门间的信任...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...的代码片段通过,它的自验证得分就会越高;通过越多高可信度测试用例的代码片段,其自验证得分也越高。自验证得分的更新公式如下:其中,d为阻尼因子,Link(c,t)表示代码片段c是否通过测试用例t。经过多次迭代后,评分逐...……更多
...好机会。“当然,这里边有很大的创新要求,在金融上对可信度、精准度要求是很高的。”据悉,未来五年,生成式AI在金融领域的应用,将成为度小满最重要的战略方向。2023年5月份,度小满开源了国内首个金融行业大模型,...……更多
2023金融大模型报告|重塑金融科技
...模型评估与关键责任划分,系统性优化大模型内容的生成可信度。此外,如何挖掘更多金融行业内的大模型应用场景,并为之匹配合适的落地方案,仍然是大模型探索中的一个重大挑战。在金融科技行业复杂的工作链条中,每个...……更多
京东云曹鹏:AI变革之下,大模型技术如何为企业未来赋能?
...;以及强化数据安全与隐私保护,确保企业大模型服务的可信度和可靠性。与此同时,京东自身也在深入思考如何将大模型与业务结合,创造价值。曹鹏表示,京东拥有复杂的业务场景和多样化的业务需求,这为大模型的应用提...……更多
旷视科技出席第六届世界人工智能大会(WAIC),共话AI创新
...;从治理角度看,挑战体现在大模型生成的内容如何具备可信度,如何避免产生偏见,如何避免技术被滥用。他强调说,面对新技术的来临,一定要边发展边治理。既要利用大模型产生更强生产力,又要采取措施有效抵御风险。...……更多
行业资讯丨2024云栖大会展现数字经济蓬勃发展态势!
...的基石,实现100%的自主知识产权掌控。以高安全性、高可信度及卓越的性能表现,为互联网数字化应用的广泛部署提供了强有力的支撑。分布式存储系统具备卓越的高可扩展性,能够灵活应对数据量的爆炸式增长,为AI应用提供...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...推理任务中,人类和语言模型都会受到语义内容合理性和可信度的影响,表现出类似的错误倾向。研究背景人类在推理过程中存在两种系统:“直觉系统”和“理性系统”,而已有知识和经验常常影响推理结果。研究表明,当面...……更多
...础设施层、数据资源层、算法模型层、应用服务层、安全可信层等关键要素。”魏凯说,未来希望依托大模型落地路线图这项研究工作,梳理大模型发展关键问题并形成落地指南,进一步引导产业各方应用和部署大模型,推进我...……更多
全球AI安全评估测试有了新基准
...解决它们的安全挑战变得至关重要。”WDTA人工智能安全可信负责任工作组组长黄连金介绍,此次发布的标准汇集了全球人工智能安全领域的专家智慧,填补了大语言模型和生成式人工智能应用方面安全测试领域的空白,为业界...……更多
2024中国AI大模型产业发展报告发布 展望五大产业趋势
...、电商、社交、搜索等渠道,存在数据类型不全面,信息可信度不高等问题。整体来看,我国可用于大模型训练的中文数据库体量严重不足。大模型爆款应用尚未出现。国内的AI大模型产业至今没有出现爆款级应用,原因在于尚...……更多
天翼云第八代升级款弹性云主机亮相
...程验证计算资产(例如可信执行环境、设备和信任根)的可信度,极大保护了数据与AI模型的安全性。天翼云第八代升级款弹性云主机的发布,标志着天翼云在云计算领域的技术实力已经达到了业界领先水平。该款产品以其卓越...……更多
斯坦福发布ai基础模型“透明度指标”
...权”、“训练模型所用的运算资源”、“模型生成内容的可信度”、“模型自身能力”、“模型被诱导生成有害内容的风险”、“使用模型的用户隐私性”等展开,共计100项。最终调查情况显示,Meta的Lama2以54%的透明度居冠,而...……更多
更多关于科技的资讯:
“内容重构论”引短剧行业共鸣
当“反转”“爽点”不再能轻易留住观众,微短剧行业正迎来一场深层重构。到2024年中,中国微短剧用户规模已接近7亿,市场体量超过500亿元
2025-10-29 14:01:00
鲸鸿动能亮相中国国际广告节&亚洲广告大会,全场景AI驱动增长
10月24日,第32届中国国际广告节&第34届亚洲广告大会在北京举办,鲸鸿动能受邀出席,并发表主题演讲《从孤岛到共生
2025-10-29 11:21:00
如何选择适合你的视频画质修复工具
在数字时代,视频已成为我们记录生活、创作内容和保存记忆的重要载体。然而由于拍摄设备限制、保存条件或传输压缩,我们常常面临视频模糊
2025-10-29 11:22:00
精工匠心极致服务!2025年小蓝翼杯全品类服务技术比武大赛圆满落幕
10月23日,2025年“小蓝翼”杯全品类服务技术比武大赛在TCL空调武汉智能工厂举行。其中,空调品类经过30个战区初赛
2025-10-29 11:30:00
‌2025年10月27日‌——上海联舌工坊科技有限公司今日正式于杨浦区完成注册,此举被视为其深化资本市场布局的关键一步
2025-10-29 12:37:00
三星电视荣登天猫艺术电视榜单 双十一钜惠助力消费者轻松解锁艺术家居生活
在消费焕新浪潮席卷家居领域、美学需求成为当代家庭核心诉求的当下,三星凭借对前沿科技与生活美学的深度解构与融合,始终站在全球艺术电视品类发展的潮头
2025-10-29 12:40:00
河北新闻网讯(吴建春)近日,由河北天翼科贸发展有限公司(简称“河北天翼”)为一家农业融资担保公司量身打造的在线收付款业财一体化项目
2025-10-29 13:31:00
宝宝巴士回应APP出现不良广告:严处审核负责人 研发广告强制拦截功能
华商网讯 10月29日,针对“宝宝巴士App出现不良广告”一事,宝宝巴士官方微信公众号发布致歉及整改声明。根据声明,对于近期用户关注的宝宝巴士App产品跳转不良广告一事
2025-10-29 13:40:00
米兰冬奥倒计时100天 国际奥委会携手阿里巴巴首次推出五环系列首饰
2026年米兰·科尔蒂纳冬奥会开幕倒计时100天之际,奥林匹克天猫官方旗舰店独家首发米兰冬奥会系列商品。同时,国际奥委会首次推出奥林匹克五环系列首饰
2025-10-29 13:47:00
王玉宝:于商业迷途中寻一盏不灭的心灯
鲁网10月29日讯踏入儒商研究会的大门,已是一载有余。今日静坐回望,恍然惊觉,这段旅程并非寻常的“加入一个组织”,倒更像是一场在商业迷途中的精神返乡
2025-10-29 13:51:00
2025上海国际压缩机展开幕 ,美的楼宇科技赋能工业制造绿色升级
10月28日-31日,2025上海国际压缩机及设备展览会(以下简称“上海国际压缩机展”)在上海新国际博览中心举办。作为核心参展商
2025-10-29 12:41:00
深圳首宗!医疗健康数据产品场内交易,十年临床数据为手术机器人研发注入“燃料”
经过严格匿名化处理和多轮合规审查,在严格遵守隐私保护的红线下,医疗数据也可以“活”起来,成为驱动AI技术发展的“燃料”
2025-10-29 12:38:00
为进一步推动国产雪茄高质量发展,持续提升阜阳市场“懂雪茄、会养护、善营销”的零售客户雪茄经营能力,提升服务质量,重振经营信心
2025-10-29 12:39:00
富士胶片X-SPACE迎来七周年朋友月 胶片模拟色彩配方书籍特别发布
2025年10月,富士胶片(中国)投资有限公司旗下X-SPACE富士胶片影像空间(以下简称"X-SPACE")迎来成立七周年
2025-10-29 10:59:00
河北纳科生物科技有限公司专利获雄安高价值专利大赛银奖
河北新闻网讯(钟蕾)近日,推进京津冀知识产权高质量发展暨2025・雄安高价值专利大赛颁奖活动在雄安新区举行。石家庄高新区优秀创新企业河北纳科生物科技有限公司凭借其核心专利“重组人胶原蛋白的制备和产业化应用”
2025-10-29 11:11:00