信通,基准,中国,模型,测试,报告头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

2023 CCF国际AIOps挑战赛决赛成功举办

...别是：中山大学的DDopS、浙商银行的系统随机生成、亿阳信通股份有限公司aiboco三支队伍。中原银行的zybank_aiops、南开大学的尊嘟假嘟战队、华为技术有限公司的轻舟队、北京城建智控科技股份有限公司的UCI四支队伍获得优秀奖...……更多

2023-12-20 13:45:00挑战赛,决赛,成功,国际,模型,南开大学

清华提出CharacterGLM；DeepMind联创发全新

...，提升其与用户的交流能力和情感认知。Inflection-2在多项基准测试中表现优异，击败了LLaMA-2、PaLM 2 Large等模型，但在两项测试中落后于GPT-4。（来源：“新智元”微信公众号）《大模型版“5年高考3年模拟”来了！6141道数学题，...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

看病就用支付宝：支付宝推出“AI健康管家”，让AI长出“手和

...、以及千万级高质量医疗知识图谱。在中英文医疗考试、基准测试中，它能达到或超过GPT4水准。其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中，位列A榜第一、B榜第二。同时，蚂蚁医疗大模型采用全栈自研医疗多模态结构、...……更多

2024-09-09 13:37:00长出,支付,管家,健康,支付,医疗

中国铁塔联合信通院发布《电信基础设施跨行业共建共享研究报告（

...行业对跨行业共建共享的理解，近日，中国铁塔联合中国信通院发布《电信基础设施跨行业共建共享研究报告（2023年）》。报告认为，实施电信基础设施跨行业共建共享，推进社会各行业资源双向开放共享和融合创新应用，不...……更多

2023-12-15 06:26:00信通,跨行业,铁塔,研究报告,中国,基础设施

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

...升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第一。在腾讯全球数字生态大会上，腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布，腾讯混元Turbo在腾讯云上线...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

谷歌Gemini数学反超o1预览版！成本仅1/10、无需额外

...7%；而在 MATH 和 HiddenMath（内部保留的竞赛数学问题集）基准测试中，两种模型有约 20% 的显著改进，其中Pro版本以86.5%的成绩超过了o1-preview（85.5%）。除此之外，在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人...……更多

2024-09-26 10:01:00成本,数学,时间,模型,数学,输出

开源版OpenAI再出「神作」，小模型吊打Llama 3！M

...ral行列，成为Mistral一员。别看仅有30亿参数，在指令跟随基准上，完全超越了Llama 3 8B，以及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试，均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。世界上最好……更多

2024-10-23 09:56:00模型,边缘,革命,模型,指令,性能

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...。OpenAI表示，新模型在物理、化学和生物等学科的挑战性基准测试中，表现超过人类专家。在国际数学奥林匹克（IMO）资格考试中，新模型得分超83%，远高于GPT-4o的13%。在Codeforces编程竞赛中，o1模型的成绩达到了前89%，而GPT-4o仅...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...过不断增加上下文长度（干扰图片的数量），将现有的VQA基准和简单图像识别集 (MNIST) 扩展为测试长上下文「提取推理」的示例。结果在简单VQA任务上，VLM的性能呈现出惊人的指数衰减。——LLM：原形毕露了家人们。而与实际研...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

氪星晚报 | 网易云音乐：三季度净收入20亿元，毛利率提至2

...险管理（20%），行为管理（30%），业务转型（10%）。中国信通院联合中国卫通和中信科移动完成基于中星26高通量卫星的NTN技术试验近日，在5G NTN工作组的组织下，中国信通院联合中国卫通、中信科移动共同完成了基于中星26高...……更多

2023-11-16 18:36:00净收入,毛利率,毛利,英国,网易,账户

痛失TOP5的小米手机，能否接好AI这碗“活水”？

...端需求持续修复，国产品牌商是最大受益者。近日，中国信通院发布2024年4月国内手机市场运行分析报告。报告显示，今年4月，国内市场手机出货量同比增长了28.8%。按品牌来看，国产品牌手机4月出货量占同期手机出货量的85.5%...……更多

2024-06-03 14:04:00活水,小米,手机,手机,小米,市场

智慧芽AI助手“芽仔”：你的智能研发专家，开启创新新范式

...专业、完整的评估体系。智慧芽率先建立了Patent-Bench评测基准，通过大模型评测平台全方位呈现大模型的评测效果。今年2月，“智慧芽文本生成大模型算法”已成功通过国家互联网信息办公室第四批境内深度合成服务算法备案...……更多

2024-03-21 16:15:00新新,范式,助手,智慧,智能,专家

谷歌 Gemini 1.5 AI 模型再进化：成本更低、性能

...附上新款模型的性能情况如下：在更具挑战性的 MMLU-Pro 基准测试中，模型的性能提高了约 7%。在 MATH 和 HiddenMath 基准测试中，数学性能显著提高了 20%。视觉和代码相关任务也有所改进，在视觉理解和 Python 代码生成评估中提...……更多

2024-09-26 09:51:00进化,更快,模型,成本,性能,模型

文本图格式大一统！首个大规模文本边基准TEG-DB发布 |

...里大学等机构的研究人员首次提出了文本边图的数据集与基准，包括9个覆盖4个领域的大规模文本边图数据集，以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究，有利于自然语言处理与...……更多

2024-11-09 13:34:00大规,本图,基准,大规模,文本,格式

护肤品功效别被夸大其词的宣传忽悠了

...+24%消费者认同”指的是受试者在连续使用产品3天后对比基准线，肌肤透亮度的自我认同度数据提升24%，即这款产品通过客观的仪器检测及主观的消费者认同测试，双重实证了其产品的美白功效。最后，消费者可以关注产品功效...……更多

2024-04-30 06:09:00护肤品,功效,宣传,功效,产品,测试

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...能会忽略或误用细节。最后，目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献，而是局限于摘要、在固定语料库上检索，或者只是直接提供相关论文。这些基准不适合作为实际科学研究任务的性能代理，更重要的...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

谷歌开源系模型第二代免费开放！27B媲美Llama3 70B

...方面，Gemma 2为8192 Tokens。性能方面，Gemma 2与Llama 3、Grok-1基准测试结果对比如下：Gemma 2 9B得分全面超越Llama 3 8B，Gemma 2 27B模型表现接近Llama 3 70B，且超越Grok-1和Qwen 1……更多

2024-07-01 09:21:00二代,模型,开放,模型,性能,网友

挑战Scaling Law，Meta发布移动端350M小模型

...优越的性能（图4），在常识推理、问答、阅读理解等8个基准测试上都有类似的趋势。这其实是非常有趣的发现，因为以往为125M量级的小模型设计架构时，一般都不会叠加超过12层。为什么要重拾「编码共享」「编码共享」（embe...……更多

2024-07-23 09:39:00模型,性能,移动,模型,参数,架构

2023年中国云计算市场规模达6165亿元同比增35.5%

...规模达6165亿元(人民币，下同)，同比增长35.5%。这是中国信通院第10次发布云计算白皮书。报告称，大模型推动云计算产业开启新一轮增长。2023年，全球云计算市场规模为5864亿美元，同比增长19.4%，在生成式AI(人工智能)、大模型...……更多

2024-07-23 22:25:00中国,规模,市场,中国,增长,市场

恒宇信通拟收购雷航电子60%股权

北京商报讯（记者丁宁）10月9日晚间，恒宇信通（300965）发布公告称，公司拟通过发行股份及支付现金的方式购买何亚平持有的西安雷航电子信息技术有限公司（以下简称“雷航电子”）60%的股权，公司股票自10月10日开市起复...……更多

2023-10-09 20:05:00恒宇,信通,股权,电子,恒宇,信通

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

奥哲受邀参编中国信通院流程数字化标准，助力行业标准化建设

近日，中国信通院“EP-Link智能流程推进计划”周年产业研讨会在北京成功召开。作为该计划的重要成员单位，奥哲受邀参与本次研讨，与众多知名企业代表和业内领袖专家共同探讨并推动行业标准编制工作。长期以来，奥哲...……更多

2024-06-14 12:45:00信通,标准,中国,标准化,流程,数字

马斯克的AI大模型登场

...的时间搞出了参数量为330亿的Grok-0原型。据称Grok-0在许多基准大模型测试中，表现出来的能力已经与参数量翻一倍的LLaMA 2相近。在那之后，团队又进行了两个月的努力迭代至Grok-1，也就是此次正式对外发布的公测版本。xAI团队...……更多

2023-11-06 09:22:00马斯克的AI大模型登场

CMU&清华：让LLM自己合成数据来学习，特定任务性能同样大

...评估 SELF-GUIDE 的有效性，研究者从 Super-NaturalInstructions V2 基准中选择了 14 个分类任务和 8 个生成任务。研究者随机选择了一半任务用于超参数搜索，剩余的一半用于评估。在模型方面，研究者选择了 Vicuna-7b-1.5 作为输入生成、...……更多

2024-08-02 09:40:00清华,性能,任务,数据,学习,生成

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...，在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准上，Gemini Ultra的性能在30项上都超过了当前最先进的模型。△图源：谷歌更惊人的是，在MMLU（大规模多任务语言理解）任务上，Gemini Ultra 的得分高达90.0%，是首个超...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

Pika爆火，但AI视频还没到「GPT时刻」；首个GPT-4

...L.T），整合了Transformer架构到隐视频扩散模型中。在UCF-101基准上，W.A.L.T取得了最佳的零样本FVD分数，展示了其可扩展性和效率。（来源：“机器之心”微信公众号）《马斯克打造的“叛逆”AI被曝抄袭ChatGPT？xAI工程师回应：我...……更多

2023-12-14 09:34:00模型,微软,人形,早报,机器人,机器

国网宁夏信通公司首次开展“便携式微波散射”设备测试

本文转自：宁夏日报近日，国网宁夏信通公司组织应急通信保障队伍开展“便携式微波散射”设备测试，模拟验证发生自然灾害造成公网大面积中断时通过“微波散射”应急通信技术为远距离无卫星信号的作业现场提供通讯联...……更多

2024-03-27 07:01:00信通,宁夏,微波,测试,设备,公司

深圳企业发布搭载AI大模型清洁机器人，开启行业全智能时代

...模态大模型NarGPT嵌入到新品中，打造了行业首个获得中国信通院“4星+”认证的可信AI大模型，并顺利通过德国莱茵的安全隐私认证。新品语音助手支持单一口令、多意图、模糊意图、问答式聊天、召唤清洁等多种模型的自然语...……更多

2024-04-19 19:27:00深圳,机器人,模型,机器,智能,时代

AGI一日要闻：台积电预测2040年GPU芯片性能提升100

...数学相关任务中的性能。在 xAI 的测试中，Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩，在 GSM8K 基准上取得了 90% 的成绩，这两个数学基准涵盖了广泛的小学到高中的竞赛问题。同时，它在评估代码生成和解决问题能力的 HumanEval 基...……更多

2024-03-31 04:00:00估值,美金,要闻,芯片,高达,性能

Claude 3.5深夜觉醒，学会模仿人类用电脑！编程干翻o

...挑战。升级版Claude 3.5 Sonnet，编码王者干翻o1在各项行业基准测试中，升级版Claude 3.5 Sonnet性能得到了全方位提升。特别是，智能体编码、工具使用任务中取得显著突破。论文地址：https://assets.anthropic.com/m/1cd9d098ac3……更多

2024-10-23 09:55:00人类,编程,模型,能力,开发,任务