• 我的订阅
  • 头条热搜
百川智能发布baichuan3稳定语言模型
...布超千亿参数的大语言模型Baichuan3。在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。而在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichua...……更多
小米SU7供应商嘉晨电子拟IPO 雷军背后入股|企业创新评测实验室
...月申请上市辅导验收,对于嘉晨电子的IPO之路,企业创新评测实验室将持续关注。“企业创新评测实验室”:由专注新兴产业与资本的权威媒体《科创板日报》发起,旨在研究公司科创实力,凭借企业科创力评估模型,从技术质...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场的自家首款多模态大模型Pixtral 12B,也疑似遇到了成绩不如人的窘境。不过世间纷扰,留待时间之中去见分晓。毕竟Mistral AI当年也...……更多
做好数字化转型,“专精特新”企业需要用好“评测罗盘”
...的怎么样?01 想要飞过数字化的“沧海”,离不开这块“评测罗盘”尽管中国数字经济整体正处于高速发展阶段,但对于“专精特新”及更多普通中小企业来说,数字化转型进程仍难言乐观。 根据中国电子技术标准化研究院发...……更多
...型“高分低能”是怎么做到的?原因其实很简单,那就是评测中出现了数据污染和泄露。简单来说,榜单排名类似于有第三方“考官”出了一个题库,题库中大量考题针对性测评大模型各个方面的能力,而有的“考生”提前拿到...……更多
自动驾驶元年临近 知行汽车科技能否跟上技术迭代?|企业创新评测实验室
...研发支出实现技术的更新迭代值得持续关注。“企业创新评测实验室”:一级市场及科创板权威媒体科创板日报联合智慧芽发起,旨在研究公司科创实力,凭借企业科创力评估模型,从技术质量、专利布局、技术影响力、公司竞...……更多
...客户从应用出发找到适合的算力支撑平台。据悉,与传统评测更看重CPU基础性能不同,《规范》是一款面向实际应用场景的评价基准,以服务器整机为评测对象,构建20多个基础性能和应用性能评测指标,其中应用性能涵盖数据...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...比如,谷歌引以为傲的MMLU,是一个由伯克利大学主导的评测,囊括阅读理解、大学数学以及物理和社会科学等57项测验。但如果说,这些题目,是可以事先得知的呢?9月,中国人民大学与伊利诺伊大学香槟分校联合推出了一个...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...,训练数据中增加了 27 种语言相关的高质量数据;多个评测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微...……更多
...自:西宁晚报在互联网平台上,针对各类商品的“第三方评测”十分常见。评测机构和博主通过测试相关产品,并就质量、价格、服务等方面作出排行,为消费者提供购物参考。记者调查发现,评测机构所使用的检测方法和标准...……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...4B和6B两个版本。据HuggingFace英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型取得了多项SOTA国际最佳性能指标认可,成为全球开源大模型“双料冠军”。零一万物创始人及CEO李开复博士表示:“零一万物坚定进军全...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...界开源模型Llama3.1-405B、Mixtral-8x22B等相比,在多学科综合评测集、中英文NLP任务、代码、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基...……更多
中国移动5g手机综合评测结果公布
中国移动近日公布了2023年度5G手机综合评测结果,32款热门机型接受了从通信能力到用户口碑的全方位考核,小米和荣耀分别在高端和中端市场夺得冠军,展现了国产手机的强大实力。5G手机测评体系,用户体验为先中国移动的5...……更多
从AI搜索到语音陪练,腾讯元宝全面评测来了!大模型C端玩家谁更胜一筹?
《科创板日报》5月31日讯(记者 朱凌)直至五月尾声,AI应用市场的火热态势依旧不减。30日,基于混元大模型的AI助手App“腾讯元宝”上线,标志着BAT终于在AI消费C端应用领域聚首。据介绍,自2023年9月首次亮相以来,腾讯混...……更多
自带副驾屏的腾势N7,座舱智能化体验如何?
...其智能化体验有着不小期待。本期咱们借CC-1000T智能座舱评测体系,看看自带副驾屏的腾势N7,会带来怎样的座舱智能化体验。一、什么是CC-1000T智能座舱评价体系CC-1000T是车云研究院与合作伙伴从消费者体验角度出发,共同研发...……更多
全球AI安全评估测试有了新基准
...案“蚁天鉴”,用于人工智能生成内容的安全性和真实性评测、大模型智能化风控、可解释性检测等。此次发布的《大语言模型安全测评方法》,便是基于“蚁天鉴”人工智能安全检测体系的应用实践,与全球生态伙伴交流编制...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...n4-Air用到的高质量通用训练数据和训练技巧,都在里面!评测结果显示,在使用百川智能优质通用训练数据与企业专有数据混合微调后,模型在金融、教育、医疗等场景下的专业细分任务的平均可用率高达96%。相比不混合通用数...……更多
AI大模型也高考?成绩单出来了,星火综合第一
...人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下: 首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和...……更多
安兔兔评测PC版正式发布:电脑强不强 不服跑个分
快科技9月12日消息,安兔兔宣布,全新的安兔兔评测PC版已经正式发布。与Android版本测试流程相似,安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy(内存和存储)和UX(用户体验)四大项,通过模拟多种复杂场景最终得到电...……更多
...能交互量表,能有效地改善传统单一量表、一对一访谈等评测方法存在的人力成本高、周期跨度长、环境干扰大、标准不统一、结果不真实的弊端。”蒋贻顺说,为了提高产品的准确性,前期经过多次分析论证,之后还征集志愿...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...通信研究院人工智能研究中心、人工智能关键技术和应用评测工业和信息化部重点实验室联合主办的“重构未来 产业智能跃迁”2023大模型产业前沿论坛上,中关村科金正式发布了国内首个企业知识大模型、AgentGraph应用开发平台...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...源模型文本长度最长的。360表示,他们在OpenCompass的主流评测数据集上验证了模型性能,包括C-Eval、AGIEval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、HumanEval、MBPP、BBH、LAMBADA,考察的能力包括自然语言理解、知识、数学计算和推……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...一。作为新一代版本,TeleChat2-115B 在9月最新公布的 C-Eval 评测 Open Access 模型综合榜单中,以 86.9 分的成绩排名第一。其通用能力较 TeleChat 系列模型提升近 30%,特别是在工具使用、逻辑推理、数学计算、代码生成和长文写作等方...……更多
...1.5-72)。经过微调的对话模型进行了客观、自动化的能力评测,评测结果显示,总分上Tele-FLM完成了对GPT-3.5-Turbo的超越。在分项得分中,Tele-FLM在总共的11个分项中有十项达到或超过GPT-3.5-Turbo水平。仅今年,中国电信人工智能研...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...中,进行开放式生成,推理过程以及各种新兴 NLP 任务的评测。 (2)对齐:对齐技术通常需要大量人工标注的成对偏好数据来训练奖励或者策略模型,通过引入 LLM-as-a-judge 技术,采用更大的模型或者策略模型本身作为评估者,...……更多
万元内的高性价比专业卡——AMD Radeon Pro W7700显卡简评
...MCD的方案,和桌面RX 7900系列产品完全一致。而我们今天评测的Radeon Pro W7700则在核心的配置上基本与消费级桌面版的Radeon RX 7700相仿。 ▲AMD Radeon Pro 7000系全家福,Radeon Pro W7700是面向中高端专业应用市场的显卡产品。在……更多
推动“AI+工业” 山东开展行业大模型揭榜挂帅
...型产品体系。引导符合条件的大模型产品积极参与国家级评测认证,增强大模型产品行业认可度与公信力。加大行业大模型产品推广应用,深度拓展应用场景,提升产业链智能化水平。事实上,自去年以来,山东省大模型产业加...……更多
RTX3090可跑,360AI团队开源视频模型FancyVideo,红衣大叔都说好
...置。论文还在 UCF-101 和 MSR-VTT Benchmark 上进行了 Zero-shot 的评测,在衡量生成视频丰富性的 IS 指标和文本一致性的 CLIPSIM 指标均取得了 SOTA 结果。 此外,论文还基于 FancyVideo 模型的 T2V 和 I2V 能力分别和前人方法……更多
...获国内头筹在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。据介绍,本次评测以新课标Ⅰ卷为考题,与河南省考卷完全相同...……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...测试,旨在通过明确的任务模糊性判断和用户意图理解来评测智能体的交互能力。IN3 基准数据的构造过程如上图所示,基于人类编写的种子任务为 Step 1,模型迭代生成新任务以增强数据集,同时从数据集中采样以作为下一轮生...……更多
更多关于科技的资讯:
8+64G起步!iPhone SE 4来了:2025年苹果继续保留64G
快科技2月17日消息,刹那数码爆料,iPhone SE 4仍然会保留64G版本,提供64G、128GB和256G三种选择
2025-02-17 18:54:00
首搭华为乾崑智驾+鸿蒙座舱!岚图梦想家新车亮相:2月19日上市
快科技2月17日消息,岚图梦想家宸星灰车色在央视《中国经济引力场》节目中亮相,并将于2月19日正式上市。新车将首次搭载华为乾崑智驾系统和鸿蒙座舱
2025-02-17 19:24:00
雕出黑悟空雪雕师又雕了6米高哪吒:让家乡人有个打卡的地方
2月17日消息,据媒体报道,随着电影《哪吒2》的走红,黑龙江鹤岗一座6米高的雪雕哪吒引发关注。据了解,哪吒雕塑的创作者曾经雕刻过黑悟空
2025-02-17 19:24:00
美国莱斯大学终身教授钮凤林已回国:专注于地震成像技术开发与应用
快科技2月17日消息,中国科学技术大学地球和空间科学学院官网显示,原任美国莱斯大学终身教授的钮凤林已回国担任中国科学技术大学地球和空间科学学院杰出讲席教授
2025-02-17 19:24:00
全球首款DeepSeek电视!创维G7F Pro发布:接入满血R1
快科技2月17日消息,据创维官方介绍,全球首款搭载DeepSeek技术的智能电视新品G7F Pro近日已发布。该机搭载机芯8R710
2025-02-17 19:24:00
华为拿下巴西大单!覆盖100城的4G/5G基站
快科技2月17日消息,巴西移动通信网络运营商iez!宣布与华为达成合作,推进4G和5G网络建设,提升网络覆盖范围和服务质量
2025-02-17 19:24:00
快科技2月17日消息,据媒体报道,近日,在山西运城盐湖景区,上演了一场飞天火壶的震撼演出,网友形容称有“哪吒闹海”的既视感
2025-02-17 19:24:00
鸿蒙智行25年全车型规划曝光:华为这套组合拳出手 友商更难了
近日,网络曝光了一份鸿蒙智行内部25年全车型规划节奏图,在智能汽车行业全面开启“淘汰赛”新阶段的背景下,揭示了华为今年在国内汽车市场的关键战役时间表
2025-02-17 19:24:00
京东超级18狂促20点开始 先领60元补贴
京东超级 18 活动来了,18元抢千元大牌爆款!今日 0 点开启,现在前往活动会场,可领取 60 元额外补贴 + 抢 18 元超级福利
2025-02-17 19:24:00
平均每月20款游戏“杭州造” 下一个中国游戏之都来了?
最近,一个数据再次刷新人们对中国游戏业产能的认知:国家新闻出版署发布2025年1月国产网络游戏审批信息,全国共有123款游戏获批
2025-02-17 19:28:00
本文转自:人民网人民网深圳2月17日电 (王星)日前,深圳市福田区政务大模型2.0版上线,启用70名基于DeepSeek开发的“AI数智员工”
2025-02-17 19:49:00
迅雷:用户下载AI大模型 提供免费加速服务
快科技2月17日消息,为满足广大AI开发者、数据科学家及研究人员对海量数据和前沿模型的迫切需求,迅雷出手了。迅雷宣布,将针对下载AI大模型及数据集文件的迅雷用户
2025-02-17 19:54:00
妈妈回应在高速应急车道停车打孩子:他要跳车 忍不到服务区了
快科技2月17日消息,日前,一条“妈妈在高速应急车道停车 下车打孩子”的视频,引起网友关注热议。视频中,这位妈妈在路边找到了一根树枝
2025-02-17 19:54:00
蔚来第三品牌首车!萤火虫核心参数曝光:搭42度电池 续航420km
快科技2月17日消息,工信部今日发布了第十四批《减免车辆购置税的新能源汽车车型目录》。目录中,我们发现了蔚来第三品牌首车萤火虫的信息
2025-02-17 19:54:00
拖拉机加装北斗导航:实现厘米级精准定位 自动规划路径
快科技2月17日消息,中国北斗卫星导航系统官方消息称,在湖北省武汉市黄陂区六指街的港湾村,一片广袤的2万亩高标准农田正焕发着科技的魅力
2025-02-17 19:54:00