• 我的订阅
  • 头条热搜
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...评估AI智能体在计算可重复性方面的表现,最简单任务的准确率可以达到60%,最难任务准确率仅有21%大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。不过现有科研辅助相关的基准测试都...……更多
... Labs团队研发的最新迭代人工智能模型AlphaFold3,能以较高准确率预测蛋白质与其他生物分子相互作用的结构,其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎所有分子类型的复合物...……更多
...科研人员一遍又一遍地认识到大模型的能量。从分析结果准确率低、需人工二次确认到分析准确率提高至95%,从每月分析600余篇到每周3000+篇医药相关信息文档,在海若大模型的加持下,齐鲁制药实现了效率和质量的双重飞跃...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...ini 1.5 Pro、InternVL-1.5、LLaVA-1.6等。在UDK-VQA数据集上的回答准确率,则配备了SearchLVLMs的SOTA LVLMs超过了自带互联网检索增强的GPT-4o模型35%。开源框架SearchLVLMsSearchLVLMs框架主要由三部分组成:查询生成……更多
...的缺陷隐患样本极少,传统小模型难以识别;且平均识别准确率低于80%,无法做到智能辅助、精确分析。南方电网广西电网公司机巡与不停电作业中心有关负责人介绍,以往依靠小模型对线路巡检图像查缺,可能会把铁塔上的树...……更多
...内部、外部和前瞻性数据集中,测试了该模型,结果显示准确率达98%。团队还进行了一项前瞻交叉试验,以进一步评估AI模型的性能和辅助能力。结果显示,该模型的准确率相较于专家内镜医师、资深内镜医师与新手内镜医师均...……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...用,也被第四代至强® 可扩展处理器赋予了新的“灵魂”,准确率飙升、响应延迟更低。同样,就在不久之前,借助第四代至强®️ 可扩展处理器在NLP上的优化,专攻医疗行业的大语言模型也成功以较低成本在医疗机构部署落地。在AI...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...过基于规则的匹配进行评估,研究团队对非编程任务使用准确率,并对编程任务使用公正的pass@k指标,定义如下: 本次评估中设定k = 1且n = 5,c表示通过所有测试用例的正确样本数量。奥林匹克竞技场奖牌榜:与奥运会使用的...……更多
京东2024年四季度收入增长13.4%,产业场景成为AI应用沃土
...经营问题、执行快捷操作,利用多智能体协同技术,决策准确率超过90%。在医疗健康场景,2025年以来,依托“京医千询”医疗大模型技术底座,京东健康发布了基于线上全域场景的大模型全系产品“AI京医”,以及业内第一个面...……更多
机器学习助力预测全球变暖趋势:30秒完成22天大气模拟
...依次向前推进系统。图片来自谷歌研究NeuralGCM的气候模拟准确率与最好的机器学习和物理方法相当。该模型对1-15天预报的准确率能媲美欧洲中期天气预报中心(ECMWF,最好的传统物理天气模型之一)的预测结果。对于最多提前10...……更多
中国财税GPT迎来最准确的大模型:小竹财税AI问世
...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型,小竹财税AI将不断提升其逻辑推理和上下文理解能力,以更好地满足用户的需求,努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多
云鼎科技:基于DeepSeek,打造垂域矿山大模型
...山能知识助手中,经测试,安全生产知识场景中对话问答准确率达96%以上。NLP 应用智能体,打通应用落地“最后一公里”只有垂域矿山大模型还不够,真正深入核心业务环节还需要链接应用,基于这个需求,云鼎科技打造了NLP...……更多
酷开超级智能体获国内首张AI硬件智能体应用成熟度证书
...障内容检索效率与速度。在用户交互感知层面,情感识别准确率达95%,并能动态调整交互策略;情景记忆实现“永久存储+关键信息零丢失”,复杂场景下仍保持高准确率;执行能力覆盖多模态操作,任务成功率与响应速度均达...……更多
...性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成代码逻辑理解也进一步提升,能够应对更复杂的编程需求,思考问题的多种可能性,帮助开发者快速实现功能。在语言理解方面,模型输出内容、格式更加...……更多
...政审计、投资审计等专项分析子系统,实现审计疑点识别准确率提升40%以上。场景创新激发应用活力。建立“场景实验室”工作机制,各业务科室结合经济责任审计、专项资金审计等不同监督场景开展沙盘推演。重点探索私有化...……更多
“奇点”临近,产业应用与人工智能怎样“共同进化”
...、机动车、非机动车等复杂道路环境时,会出现交互识别准确率下降等问题。”省智能网联汽车产业创新联盟理事长、江苏智行未来汽车研究院院长华国栋举例说,比如,如何将10米以内的目标障碍物识别误差控制在5厘米以内,...……更多
​海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
...报数据,系统通过“大小模型协同+RAG检索”技术,实现准确率超98%的舆情精准定位,并能够超前预警潜在舆情风险;在自动化指挥调度环节,系统基于众多城市交通保障经验与专家经验,融合实时路况与三级预测体系,能够实...……更多
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
...GPT-4o和Gemini-1.5-pro表现最佳,分别达到了56.1%和55.2%的平均准确率。在所有细分领域中,GPT-4o在摩擦和加速度方面表现优越。相比之下,Gemini-1.5-pro在理解与重力、弹性、反射、吸收与透射、颜色和刚性相关的物理常识方面表现更...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...验评估方面,HourVideo采用五选多任务问答(MCQ)任务,以准确率作为评估指标,分别报告每个任务以及整个数据集的准确率。由于防止信息泄露是评估长视频中的MCQ时的一个重要挑战——理想情况下,每个MCQ应独立评估,但这种...……更多
常见电子邮件分类算法的性能分析
...贝叶斯算法学习曲线,红色线代表测试集(学习过程中)的准确率(Score),绿色线代表该模型在测试集上的准确率,线两侧的半透明带的宽度代表方差(方差越小,模型稳定性越好,泛化性能越好)。从图1可看出,随着训练量(Train examp...……更多
浙里有AI,电信服务更有爱
...,提升工单处理效率,并搭建自学习训练流程,稳步提升准确率,工单结案时长也由原来的4-5分钟压缩至1-2分钟。话后—智能分析短板,提升服务能效面向后台支撑人员,如质检人员,为快速提升质检效率与质量,上线了服务质...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...T-4o mini 仅 37.6 分,ChatGLM3-6B 和 Qwen2.5-1.5B 仅 11.2 和 11.1 的准确率。基于中文 SimpleQA,我们对现有 LLM 的事实性能力进行了全面的评估。并维护一个全面的 leaderboard 榜单。同时我们也在评测集上实验分析了推理 s……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...点。实验结果显示,耦合方法使模型性能大幅提升,理解准确率提高 19.48%,生成准确率提高 26.07%,且数据效率更高。在语言方面,耦合系统的有效词汇增加,与人类语言更相似,词汇漂移减少。 杰出论文再来看看杰出论文的...……更多
【数字教育绘荆楚】全球首套!武科大破解焦炉砌筑“卡脖子”难题
...度学习算法与高精度传感技术,实现耐火砖98%以上的识别准确率与±1mm的砌筑精度。其“一键砌筑”远程操控功能,更将工业物联网与数字孪生技术深度结合,让复杂工艺全流程智能化控制成为现实。 从虚拟建模到实体操作依...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的正确率高于原正确率(图4) 正确率提升与自我评估的准确率高度相关(图4(c):),甚至呈线性关系(图5(a))。 采用不同的评价方式效果依次提升:仅使用对/错评价 < 自然语言评价 < 包含 CoT 的对/错评价。这是因为 C...……更多
首个职教行业大模型发布,粉笔AI老师助力高效学习
...过不断的数据标注和算法优化,目前粉笔大模型意图识别准确率可以达到 98% 以上,可以显著改善幻觉问题。「基于粉笔独有的数据、教研的长期积累和对于用户的深度洞察,我们得出判断,垂域模型一定可以在公考领域实现比...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
...所有测试的类o1模型都存在显著的思维不足问题。模型的准确率与思维不足之间的关系在不同数据集上表现各异。在MATH500-Hard和GPQA Diamond数据集上,性能更优的DeepSeek-R1-671B模型在取得更高准确率的同时,其UT得分也更高,表明错...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题,是否会导致其在行业应用面临较大的挑战?比如对准确率要求比较高的教育、医疗、金融等行业?赵东岩:是的,所以在这些关键领域,模型的对齐效果非常关键。实践中,可以通过多次校验,对齐,RAG来改善大模型的幻...……更多
...污染成因分析等场景,其24小时空气质量指数(AQI)预报准确率高达94.4%,较传统方法准确率提升超30%,PM2.5与臭氧预报准确率分别达86.3%、79.2%,预报准确率稳居同类监测系统前列。如何大幅提升环境空气预报的精度与准度,系...……更多
更多关于科技的资讯:
联通客户日 暖冬送温情——福建联通VIP客户答谢会在三明圆满落幕
活动现场。东南网11月26日讯(通讯员 肖锦雯)近日,以“联通客户日 暖冬回馈季”为主题的福建联通VIP客户答谢会在三明市徐锦新城小区温馨启幕
2025-11-26 12:50:00
梦百合家居董事长倪张根亮相沈阳“梦粉见面会”,发布适老化智能床新品
近日,知名睡眠品牌MLILY 梦百合在沈阳京东MALL发布适老化智能床系列新品,并针对沈阳大东区社会福利院展开公益捐赠
2025-11-26 13:04:00
BORCHERS®亮相中国国际涂料展,以本地化创新与全球技术推动行业可持续发展
在今天开幕的 2025 中国国际涂料展上,美利肯涂料添加剂品牌BORCHERS®于 W2.F21 展位(展馆 W2)再次携核心解决方案亮相
2025-11-26 13:37:00
国际大咖为“南京故事”国际传播支招在中国制作 向世界传播南报网讯(记者乔雅萱)11月22日上午,南京国际传播中心揭牌仪式现场
2025-11-26 10:27:00
江苏南京:链接全球资本!宁企赴港上市热潮涌动
□南京日报/紫金山新闻记者曹丽珍今年以来,一股赴港上市浪潮正在全国范围内持续奔涌。相关数据显示,今年前三季度,中国企业境外首次公开募股(IPO)的活跃度大幅回升
2025-11-26 10:27:00
江苏南京:一张购物小票,掘出一座“数据金山”
南京加快释放数据要素价值培育壮大数据产业一张购物小票,掘出一座“数据金山”晓数通社区微数据中心。 江苏荣泽信息科技股份有限公司供图数族科技
2025-11-26 10:27:00
南报网讯(记者朱旖旎通讯员刘芳)深秋的南京,一场跨越山海的双向奔赴正在发生。近日,2025中欧机器人产业合作(南京)对接会在栖霞区召开
2025-11-26 10:28:00
医疗器械“产学研医”对接会举办
近日,2025南京医疗器械“产学研医”对接会在高淳举办,高校、医院、企业等多方代表齐聚。活动搭建协同平台,助力产业创新与成果转化
2025-11-26 10:28:00
在长三角文博会上亮出“文化家底”和数字创新实力南京打造微短剧产业集聚高地□南京日报/紫金山新闻记者朱静近日,一场聚焦微短剧的产业合作交流活动在国家会展中心(上海)火热举办
2025-11-26 10:28:00
江苏南京:相约十年,让制造更聪明
相约十年,让制造更聪明——写在2025世界智能制造大会即将召开之际□南京日报/紫金山新闻记者徐宁 实习生黄倩“作为南京智能制造产业的标杆力量
2025-11-26 10:28:00
智能工厂运营效率提升
近日,在南京天加环境科技有限公司今年5月投产的天加洁净基地内,高度自动化生产线正生产发泡板机、换热器等核心零部件。该生产基地建立了从客户需求到最终交付的“端到端”全流程数字化运营体系
2025-11-26 10:28:00
东南网11月26日讯(福建日报记者 李珂) 记者从厦门大学获悉,日前,该校萨本栋微米纳米科学技术研究院吴德志教授团队在3D打印技术领域取得突破性进展——首创“激光原位诱导直写打印”技术
2025-11-26 10:34:00
厦门网讯(厦门日报记者 张珺 通讯员 吴冰冰)我市跨境电商生态再添新支点,日前,POD(按需定制)专卖孵化平台公司正式落户银城智谷海熹跨境电商产业园
2025-11-25 08:11:00
AI赋能千行百业一线故事(十七):这位“农事专家”,让种地更聪明
这位“农事专家”,让种地更聪明——AI赋能千行百业一线故事(十七)11月14日,雄安新区都市农业科技博览园温室大棚内,工作人员查看番茄长势
2025-11-25 08:41:00
荣耀加冕!锦程酒管多店荣登消费者喜爱榜-2025年中国高端酒店100强
2025 年 11 月 20 日-21日—— 在备受文旅与酒店行业瞩目的 “2025 迈点文旅节・第七届迈点酒店运营创新大会” 上
2025-11-25 09:25:00