• 我的订阅
  • 头条热搜
2023 CCF国际AIOps挑战赛决赛成功举办
...别是:中山大学的DDopS、浙商银行的系统随机生成、亿阳信通股份有限公司aiboco三支队伍。中原银行的zybank_aiops、南开大学的尊嘟假嘟战队、华为技术有限公司的轻舟队、北京城建智控科技股份有限公司的UCI四支队伍获得优秀奖...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...,提升其与用户的交流能力和情感认知。Inflection-2在多项基准测试中表现优异,击败了LLaMA-2、PaLM 2 Large等模型,但在两项测试中落后于GPT-4。(来源:“新智元”微信公众号)《大模型版“5年高考3年模拟”来了!6141道数学题,...……更多
看病就用支付宝:支付宝推出“AI健康管家”,让AI长出“手和脚”
...、以及千万级高质量医疗知识图谱。在中英文医疗考试、基准测试中,它能达到或超过GPT4水准。其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中,位列A榜第一、B榜第二。同时,蚂蚁医疗大模型采用全栈自研医疗多模态结构、...……更多
...行业对跨行业共建共享的理解,近日,中国铁塔联合中国信通院发布《电信基础设施跨行业共建共享研究报告(2023年)》。报告认为,实施电信基础设施跨行业共建共享,推进社会各行业资源双向开放共享和融合创新应用,不...……更多
腾讯推出新一代大模型“混元Turbo”,性能大幅提升,定价低50%
...升100%,推理成本降低50%,解码速度提升20%,效果在多个基准测试上对标GPT-4o,第三方测评居国内第一。在腾讯全球数字生态大会上,腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线...……更多
谷歌Gemini数学反超o1预览版!成本仅1/10、无需额外思考时间
...7%;而在 MATH 和 HiddenMath(内部保留的竞赛数学问题集)基准测试中,两种模型有约 20% 的显著改进,其中Pro版本以86.5%的成绩超过了o1-preview(85.5%)。除此之外,在视觉理解和代码代码生成的评估中也有2%-7%的提升。根据开发人...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...ral行列,成为Mistral一员。别看仅有30亿参数,在指令跟随基准上,完全超越了Llama 3 8B,以及前辈模型Mistral 7B。而且Ministral 3B和Ministral 8B在大模型竞技场中的测试,均拿下了媲美Gemma 2、Llama 3.1开源模型的成绩。 世界上最好……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...。OpenAI表示,新模型在物理、化学和生物等学科的挑战性基准测试中,表现超过人类专家。在国际数学奥林匹克(IMO)资格考试中,新模型得分超83%,远高于GPT-4o的13%。在Codeforces编程竞赛中,o1模型的成绩达到了前89%,而GPT-4o仅...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...过不断增加上下文长度(干扰图片的数量),将现有的VQA基准和简单图像识别集 (MNIST) 扩展为测试长上下文「提取推理」的示例。结果在简单VQA任务上,VLM的性能呈现出惊人的指数衰减。——LLM:原形毕露了家人们。而与实际研...……更多
...险管理(20%),行为管理(30%),业务转型(10%)。中国信通院联合中国卫通和中信科移动完成基于中星26高通量卫星的NTN技术试验近日,在5G NTN工作组的组织下,中国信通院联合中国卫通、中信科移动共同完成了基于中星26高...……更多
痛失TOP5的小米手机,能否接好AI这碗“活水”?
...端需求持续修复,国产品牌商是最大受益者。近日,中国信通院发布2024年4月国内手机市场运行分析报告。报告显示,今年4月,国内市场手机出货量同比增长了28.8%。按品牌来看,国产品牌手机4月出货量占同期手机出货量的85.5%...……更多
智慧芽AI助手“芽仔”:你的智能研发专家,开启创新新范式
...专业、完整的评估体系。智慧芽率先建立了Patent-Bench评测基准,通过大模型评测平台全方位呈现大模型的评测效果。今年2月,“智慧芽文本生成大模型算法”已成功通过国家互联网信息办公室第四批境内深度合成服务算法备案...……更多
谷歌 Gemini 1.5 AI 模型再进化:成本更低、性能更强、响应更快
...附上新款模型的性能情况如下:在更具挑战性的 MMLU-Pro 基准测试中,模型的性能提高了约 7%。 在 MATH 和 HiddenMath 基准测试中,数学性能显著提高了 20%。 视觉和代码相关任务也有所改进,在视觉理解和 Python 代码生成评估中提...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与...……更多
护肤品功效别被夸大其词的宣传忽悠了
...+24%消费者认同”指的是受试者在连续使用产品3天后对比基准线,肌肤透亮度的自我认同度数据提升24%,即这款产品通过客观的仪器检测及主观的消费者认同测试,双重实证了其产品的美白功效。最后,消费者可以关注产品功效...……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
...能会忽略或误用细节。最后,目前科学文献的检索和推理基准尚不完善。AI 无法参考整篇文献,而是局限于摘要、在固定语料库上检索,或者只是直接提供相关论文。这些基准不适合作为实际科学研究任务的性能代理,更重要的...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...方面,Gemma 2为8192 Tokens。性能方面,Gemma 2与Llama 3、Grok-1基准测试结果对比如下:Gemma 2 9B得分全面超越Llama 3 8B,Gemma 2 27B模型表现接近Llama 3 70B,且超越Grok-1和Qwen 1……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...优越的性能(图4),在常识推理、问答、阅读理解等8个基准测试上都有类似的趋势。这其实是非常有趣的发现,因为以往为125M量级的小模型设计架构时,一般都不会叠加超过12层。为什么要重拾「编码共享」「编码共享」(embe...……更多
2023年中国云计算市场规模达6165亿元 同比增35.5%
...规模达6165亿元(人民币,下同),同比增长35.5%。这是中国信通院第10次发布云计算白皮书。报告称,大模型推动云计算产业开启新一轮增长。2023年,全球云计算市场规模为5864亿美元,同比增长19.4%,在生成式AI(人工智能)、大模型...……更多
恒宇信通拟收购雷航电子60%股权
北京商报讯(记者 丁宁)10月9日晚间,恒宇信通(300965)发布公告称,公司拟通过发行股份及支付现金的方式购买何亚平持有的西安雷航电子信息技术有限公司(以下简称“雷航电子”)60%的股权,公司股票自10月10日开市起复...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目...……更多
奥哲受邀参编中国信通院流程数字化标准,助力行业标准化建设
近日,中国信通院“EP-Link智能流程推进计划”周年产业研讨会在北京成功召开。作为该计划的重要成员单位,奥哲受邀参与本次研讨,与众多知名企业代表和业内领袖专家共同探讨并推动行业标准编制工作。 长期以来,奥哲...……更多
马斯克的AI大模型登场
...的时间搞出了参数量为330亿的Grok-0原型。据称Grok-0在许多基准大模型测试中,表现出来的能力已经与参数量翻一倍的LLaMA 2相近。在那之后,团队又进行了两个月的努力迭代至Grok-1,也就是此次正式对外发布的公测版本。xAI团队...……更多
2023-11-06 09:22:00马斯克的AI大模型登场
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...评估 SELF-GUIDE 的有效性,研究者从 Super-NaturalInstructions V2 基准中选择了 14 个分类任务和 8 个生成任务。研究者随机选择了一半任务用于超参数搜索,剩余的一半用于评估。在模型方面,研究者选择了 Vicuna-7b-1.5 作为输入生成、...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...,在大型语言模型 (LLM) 研发中使用的32个广泛使用的学术基准上,Gemini Ultra的性能在30项上都超过了当前最先进的模型。△图源:谷歌 更惊人的是,在MMLU(大规模多任务语言理解)任务上,Gemini Ultra 的得分高达90.0%,是首个超...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...L.T),整合了Transformer架构到隐视频扩散模型中。在UCF-101基准上,W.A.L.T取得了最佳的零样本FVD分数,展示了其可扩展性和效率。(来源:“机器之心”微信公众号)《马斯克打造的“叛逆”AI被曝抄袭ChatGPT?xAI工程师回应:我...……更多
本文转自:宁夏日报近日,国网宁夏信通公司组织应急通信保障队伍开展“便携式微波散射”设备测试,模拟验证发生自然灾害造成公网大面积中断时通过“微波散射”应急通信技术为远距离无卫星信号的作业现场提供通讯联...……更多
...模态大模型NarGPT嵌入到新品中,打造了行业首个获得中国信通院“4星+”认证的可信AI大模型,并顺利通过德国莱茵的安全隐私认证。新品语音助手支持单一口令、多意图、模糊意图、问答式聊天、召唤清洁等多种模型的自然语...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...数学相关任务中的性能。在 xAI 的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。同时,它在评估代码生成和解决问题能力的 HumanEval 基...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...挑战。升级版Claude 3.5 Sonnet,编码王者干翻o1在各项行业基准测试中,升级版Claude 3.5 Sonnet性能得到了全方位提升。特别是,智能体编码、工具使用任务中取得显著突破。 论文地址:https://assets.anthropic.com/m/1cd9d098ac3……更多
更多关于科技的资讯:
法务部出击!Switch 2泄露厂商被任天堂找麻烦了
前段时间,配件厂商Genki在2025年CES展会上展示了一款Switch 2的实体模型,这引发了任天堂法务部关注。据报道
2025-01-12 10:22:00
CFO,全面接管中国互联网大厂
作者:徐晓倩过去一年,中国互联网的权力中心逐渐向CFO倾斜。2024年最后一天,盒马鲜生(以下简称盒马)新任CEO严筱磊宣布
2025-01-12 16:11:00
高速突现事故车 问界M7自动变道刹停!车主:华为智驾保我全家性命
快科技1月12日消息,近日,有问界M7 Ultra车主发布视频称,感谢赛力斯、华为智驾保我全家性命。车主公布的行车记录仪视频显示
2025-01-12 10:22:00
设计不会变了 蔚来萤火虫“三眼灯”确认:辨识度超高
快科技1月12日消息,在去年举办的蔚来NIO DAY上,蔚来第三品牌萤火虫首发,采用了非常独特的“复眼”大灯,这样的方案引发了不少争议
2025-01-12 10:22:00
本文转自:人民网人民网北京1月12日电 (唐佳)1月11日,中国国土经济学会低空经济专业委员会在京成立,并举行了低空经济与国土空间高质量发展论坛
2025-01-12 10:46:00
三轮车逆行全责撞上宾利 修车要几十万!宾利车主走代位追偿引热议
快科技1月12日消息,据报道,近日,浙江衢州,一位卖猪肉的老人开三轮车逆行下山,撞上了正常行驶的宾利欧陆GT轿车。事故现场照片显示
2025-01-12 10:52:00
福特电马突然变砖:婴儿一度被困车内、砸窗解救
快科技1月12日消息,海外媒体报道,近日,美国洛杉矶一辆福特电马电动门突然失灵无法解锁,导致车主9个月大的孩子被困车内将近1小时
2025-01-12 10:52:00
曝新款特斯拉Model Y九大产品核心亮点:舒适性提升占比超一半
快科技1月12日消息,毫无征兆,新款特斯拉Model Y就这样上市开卖了,仅提供两个版本,价格为26.35-30.35万元
2025-01-12 11:22:00
山火失控顶级富人区被烧毁:靠海的洛杉矶为何缺水灭火
1月12日消息,本月7日,美国加利福尼亚州南部地区突发山火,在大风助推下迅速蔓延,从加州南部的洛杉矶烧至好莱坞。好莱坞是富人聚集地
2025-01-12 11:22:00
2025年1月9日,微盟集团宣布推出“微盟X微信小店”系列解决方案,旨在帮助商家在微信小店生态中实现高效整合与业务增长
2025-01-12 11:52:00
每日一图|鸳鸯戏水
本文转自:人民网-浙江频道孙鹏
2025-01-12 11:56:00
年轻人的第一台跑车!小跑车SC01发起申报:搭载双电机+四驱
快科技1月12日消息,江西江铃集团新能源汽车有限公司生产的羿驰牌小跑车SC01申报信息曝光。该车采用纯电进行驱动,搭载前后双电机四驱系统
2025-01-12 12:22:00
高速上车胎被扎破男子将道路管理方告上法庭:索赔1250元
1月12日消息,高速路上轮胎被扎破,那么能否向道路管理方索赔呢?近日,一男子驾车行驶在高速公路上,被一块铁片扎破轮胎,险些酿成车祸
2025-01-12 12:22:00
□言嘉当下招聘中,已有不少公司尤其是金融机构都使用了AI(人工智能)作为面试官,面试的地点在家里,面试考官是电脑屏幕上虚拟的AI形象
2025-01-12 12:34:00
江苏首家!江苏时代获评工业4.0奖
近日,江苏时代荣获由欧洲知名管理咨询集团瑞欧盈-埃非索管理咨询公司(ROI-EFESO)颁发的工业4.0中国奖“智能可持续奖项”
2025-01-12 12:50:00