• 我的订阅
  • 头条热搜
全球首个!西电“玄知”密码大模型问世!
...,包含 10,000+道精编题目,实现能力边界精准探测。建立版本迭代流程,持续适配密码技术演进需求。在权威测评基准CryptoBench的全面评估中,玄知大模型(CryptoLLM)展现出全球领先的密码学专业能力:其综合性能超越当前最优...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...级算法,专注于数学奥赛问题,作为OpenAI草莓项目的开源版本。10月初,团队上传新论文,使用成对优化(不直接给出绝对分数,而是比较两个答案的相对优劣)提高Llama模型数学奥赛能力。在最难的AIME2024基准测试30道题中,原...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...行训练,可能在多语言或长上下文上表现不佳。在未来的版本中,作者计划包括对更多具有更长上下文的多语言数据集的训练。最后,这项工作一直以有监督的多任务方式训练FLAMe模型。探索RLHF和DPO等其他训练方法是未来工作的...……更多
更快、更强、更经济!港大开源大模型RAG系统LightRAG
...,同时具备对新数据快速适应的能力。在多个数据集上的实验表明,LightRAG在检索准确性和响应多样性方面均优于现有的基线模型,并且在资源消耗和动态环境适应性方面表现更优,使其在实际应用中更为有效和经济。随着大语...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...,开发人员便可在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用,而且该版本也已经在网页版中为Gemini Advanced开放试用,移动版后续也将推出。为了帮助开发者构建动态和交互式应用程序,谷歌还发布了新的Multimodal Live API..……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。本文的主要作者来自上海交通大学和上海人工智能实验室智慧医疗联合团队...……更多
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...作与炫酷特效》。今年 5 月份,豆包视频生成模型的早期版本开始在即梦 AI 上应用,收获了不少好评。现在又过去了几个月时间,豆包视频生成模型已经完成迭代升级,能力更是大幅提升,机器之心也测试体验了其最新版本。...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-Reasoner在金融决策、能源负载预测和因果关系挖掘等多个任务上,相较于现有方法具有显著的性能优势。随着近年来大型语言模型(LLMs)的迅速发展,学...……更多
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
...厂,另一呼声来自Midjourney V7。Midjourney于8月1日发布了v 6.1版本,且官方一直透露正在测试V7,所以很多人猜测Midjourney有偷偷提前测试的可能。(匿名竞技场测试,很熟悉的配方了) 还有人猜测是中杯Stable Diffusion 3.5,这是Stabili……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社区信息显示,Janus-Pro是去年发……更多
Sora泄露了三小时,网友调侃Altman急拔网线,艺术家们抗议被白嫖
...,这些泄露的 API 背后是速度更快的 Sora Turbo 版,更大的版本并未被泄露。正如 The Information 之前报道的那样,请求负载表明存在多个模型(提到「turbo」模型),以及不同的「风格」(Hugging Face 空间中使用的是「自然」风格) ...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...一方法的有效性,我们在多个公共数据集上进行了广泛的实验,这些实验涉及多种时空预测任务。实验结果一致显示,UrbanGPT 在性能上始终超越了现有的顶尖模型。这些成果证明了在数据标记较少的情况下,利用大型语言模型进...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...,从而动态地、分步骤地解决问题。近日,华为诺亚方舟实验室、伦敦大学学院(UCL)和达姆施塔特工业大学的一个研究团队在这个研究方向上做出了自己的贡献。他们采用第一性原理方法,将数据的分析、处理和预测(即数据...……更多
Google 创始人谢尔盖·布林回归,直面 Gemini、Google、AGI 若干问题
...试一试。这应该会产生很大的影响。你们正在试用的这个版本Gemini 1.5 Pro,并没有在公众端的应用中,我们曾经的 Bard,并不应该有太大的影响,除了一个普遍的情况:如果你对任何 AI 模型进行彻底的测试,总会出现一些奇特的...……更多
交通类 AI 项目预演阶段,本地化部署的一些新思路
...能化升级和物流的智能化转型。大部分应用场景仍在项目实验阶段。此阶段需要有效地平衡项目需求、成本和开发效率。在项目预演阶段中,通常小规模算力就可以满足需求。此阶段主要是对模型的可行性、架构设计的合理性以...……更多
谷歌AlphaFold 3在《自然》杂志刊登:准确率超50%
...bs共同署名的论文,介绍了AlphaFold3,这是AlphaFold的第三代版本,全新的蛋白质结构预测系统能以前所未有的精度预测“蛋白质数据库(ProteinDataBank)”内几乎所有分子类型的复合物结构。论文称,AlphaFold3是一款革命性的系统。...……更多
安兔兔评测pc版正式发布,欢迎大家下载体验
...兔官网以及各大渠道上线,欢迎大家下载体验。与Android版本测试流程相似,安兔兔评测PC版测试项目同样包括了CPU、GPU、Memroy(内存和存储)和UX(用户体验)四大项,通过模拟多种复杂场景最终得到电脑性能评分。另外,除了...……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...试集HumanEvalCoding的测试中,日日新·商量大语言模型-通用版本(SenseChatV4)的一次通过率达到75.6%(GPT-4此项数据为74.4%),代码解释器则在数据分析场景下的数据测试集(1000+题目)中以85.71%的正确率超过GPT-4。基于商汤“日日新...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文由 HMI Lab 完成。HMI Lab.……更多
...AIGC应用。在技术交流日,记者发现,这五大模型以全新版本全面亮相,其中一些局部能力甚至赶超GPT-4。大语言模型完成各种任务的基础,是能够理解用户提出的问题,并搞清楚文字背后的意图。许多中国的公司比较自研模型与...……更多
...德”、Anthropic公司的“克劳德2”和元宇宙公司Llama的三个版本。例如,它们如何应对“比例偏差”?“比例偏差”指的是比起正确比例的方案,更倾向于元素最多的方案。一个盒子里有9个白球和1个红球,另一个盒子有92个白球...……更多
指令跟随大比拼!Meta发布多轮多语言基准Multi-IF:覆盖8种语言,超4500种任务
...,研究团队采用了以下方法将数据集从英文扩展至多语言版本:1. 自动翻译:使用Llama 3.1 405B模型将原始英语指令翻译为中文、法语、俄语、印地语、西班牙语、意大利语和葡萄牙语七种语言。2. 人工校对:翻译结果经过语言专...……更多
OpenAI o1 模型 PlanBench 规划能力实测:准确率 97.8%
...确率为 62.6%)。在更具挑战性的“Mystery Blocksworld”加密版本中,传统模型几乎全部失败,而 OpenAI 的 o1 模型准确率达到 52.8%。IT之家附上报告图片如下:研究人员还测试了一种新的随机变体,以排除 o1 的性能可能源于其训练集...……更多
入职一年半,这个AI员工晋升为了国内首位AI架构师
...学习开发者大会上拥有了自己的中文名,并升级到了 2.5 版本。算起来,自 2023 年 4 月推出以来,文心快码已经是一位「练习时长快一年半」的 AI 程序员了。在岗这么长时间,文心快码现已支持了 C/C++、Java 等 100 多种编程语言...……更多
马斯克xAI发布首款大模型;苹果发布M3芯片;ChatGPT被曝仅200亿参数|本周硅谷发生了什么?
...平台实时访问信息,具有互联网浏览能力,还有一个本地版本,可以在特斯拉汽车上运行。OpenAI的联合创始人兼首席科学家Ilya Sutskever采访称,AI可能已经有意识,当前首要任务是研究“如何阻止超级AI的失控”。与此同时,被誉...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...用效能的模式。 上新了,上新了,卓世科技MaaS平台V2.0版本正式上线。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发...……更多
昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyReels-V1,重塑AI短剧行业格局
...图2所示,在同等RTX4090资源情况下对比(4卡),SkyReels-Infer版本比HunyuanVideo官方版本端到端延迟减少58.3%(293.3s vs 464.3s);SkyReels-Infer版本具备更鲁棒的部署策略,支持用户级别显卡1卡-8卡的推理部署。图2丨推理生成544……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
...被研究者称为Underthinking(欠思考)。研究团队来自腾讯AI实验室、苏州大学和上海交通大学,主要研究对象是开源的DeepSeek-R1和Qwen QwQ系列模型。通过分析AI的错误答案,他们发现当前的推理大模型经常在思考早期就走上了正确的...……更多
OpenAI开启调查:GPT-4o及4o-mini模型性能下降
...理长上下文中的复杂信息并生成相应回复的能力而设计。实验结果略显意外:包括GPT-4o在内的众多顶尖模型,虽然在常规长上下文回忆基准测试中表现优异,但在应对复杂的长文本生成任务时,仍暴露出显著的改进需求。具体而...……更多
科技成就伟大:游戏生成式AI与游戏工业化
...太理解。简单来说,如果你了解LLaMa的话,就知道LLaMa有70B的版本、35B的版本、30B的版本,或者7B的版本,就像中杯、大杯、超大杯的感觉。但具体到我们的部署,如果你部署过LLaMa,要在本地你自己能买到的硬件条件下部署一个70B的版本,...……更多
更多关于科技的资讯:
清华大学安徽校友会AI大数据专委会揭牌
大皖新闻讯 11月20日,清华大学安徽校友会AI大数据专委会揭牌仪式暨人工智能前沿洞察与产业创新论坛在中国视界举行。人工智能是安徽省十大战略性新兴产业之一
2025-11-21 12:23:00
中新经纬11月21日电 据中消协网站21日消息,近日,有媒体曝光了一批盗版剧APP,这些APP不仅盗用大量剧集资源,更会窃取用户个人隐私信息
2025-11-21 12:37:00
“消失的法老”回来了!“BesTV上海博物馆”今天上线 计划实现上海电视用户全覆盖
11月18日,“廿念不忘,帧帧日上——百视通成立20周年分享会”在国际会议中心举行。作为20周年重磅发布之一,由百视通与上海博物馆联合打造的“BesTV上海博物馆”产品正式亮相并登陆上海移动高清电视
2025-11-20 08:06:00
入住4年仍甲醛超标!福建卫视《现场》探访实录,解码智能门的健康升级路径
近日,福州居然之家王力安防门店迎来了一位特别的客人——消费者丁先生专程送来一面写有“贴心服务暖人心,智能监测护健康”的锦旗
2025-11-20 08:06:00
厦门网讯(厦门日报记者 林露虹) 近日,专注于毫米波雷达芯片研发的厦企——矽杰微电子(厦门)有限公司(简称“矽杰微电子”)完成C1轮增资
2025-11-20 08:29:00
厦门围绕“金鸡”品牌 在影视产业链上持续发力
陈铎(中)指导员工进行《活宝档案》动画制作。海丝(厦门)电影工业产业基地施工现场。 厦门网讯(文/图 厦门日报记者 邬秀君)走进位于软件园一期的继来之(厦门)人工智能研究院有限公司
2025-11-20 08:30:00
记者走基层|集装箱“搬上”无人车 解锁配送新技能
11月1日,在廊坊座头鲸科技有限公司智能制造基地,工作人员对蓝丁智能无人配送车底盘进行性能测试。 河北日报记者 刘 杰摄11月1日清晨
2025-11-20 08:49:00
破局之法,精耕之道 《精耕者访谈》第三季·区域之王重磅开启!
11月18日,由蓝河乳业独家冠名的《精耕者访谈》第三季·区域之王正式启动。作为母婴行业首个高端访谈栏目,其始终着眼于市场一线
2025-11-20 09:06:00
北京博大健康体检管理中心盛大启幕 以“科技+精准”重新定义健康管理新标杆
11月18日上午,北京博大健康体检管理中心(简称“博大体检”或“中心”)在京举行开业典礼,正式落地北京经济技术开发区南海绿茵国际园区
2025-11-20 09:06:00
以儿童为本——赖园青的幼儿教育科学实践之路
在人工智能与教育深度融合的浪潮中,如何让技术真正服务于幼儿认知发展?上海浦东新区民办普瑞姆幼儿园园长赖园青用贯穿理论与实践的智慧教育探索
2025-11-20 10:06:00
山东移动招远分公司秋冬宽带服务义诊暖心启动 专业服务守护数字生活
胶东在线11月19日讯(通讯员王少娜徐冰鑫)秋冬时节,居民居家上网需求激增,网络卡顿、信号盲区、设备老化等问题更易影响用户使用体验
2025-11-20 10:17:00
四梯科技重磅发布智能产业工程师证书项目 推动教育科技人才一体化发展
2025年11月14日,在深圳第二十七届中国国际高新技术成果交易会第二届产教融合与科教融汇论坛上,北京四梯科技有限公司(以下简称“四梯科技”)首次面向社会正式发布“四梯智能产业工程师证书项目”(4T SIEC)
2025-11-20 11:37:00
一屏承古韵,元景越千年!联通数智重构文博文创新范式的野望
11月17日,“中华文明起源系列——‘看·见殷商’”展览总结暨博物馆高质量发展研讨会在北京大运河博物馆举行。会上回顾了“看·见殷商”展览的创新实践
2025-11-20 12:07:00
名创优品斩获国际零售地产大奖MAPIC 2025\
在法国戛纳举办的 2025 年全球零售商业地产峰会大奖(MAPIC Awards)中,名创优品凭借其MINISO LAND战略级店态
2025-11-20 14:38:00