• 我的订阅
  • 头条热搜
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...论文地址:https://arxiv.org/abs/2410.10934v1研究人员提出了DevAI基准,为全新框架提供概念验证测试平台。包含55个真实的AI开发任务,带有详细的手动注释。通过对三个领先的智能体系统进行基准测试,发现它大大优于「LLM-as-a-Judge」...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
医渡科技协办第四期CDO研讨活动召开,推进数字医疗安全建设
...附属医院信息中心主任周敏,医渡科技 CTO、首席人工智能科学家闫峻,华为上海政企医疗行业CIO朱紫筵,华为数据保护首席架构师孙思远。国家卫生健康委员会统计信息中心副主任胡建平、上海市卫生健康统计中心书记、主任陈雯...……更多
...等前沿技术的广泛应用,服务器应用场景日益丰富,从大数据分析到深度学习模型训练,任务类型日趋多样化。与此同时,降低能源成本和数据中心碳排放的压力不断增加,服务器能效提升成为必然趋势,从而引导服务器厂商提...……更多
...异会导致模型的预测结果与实际情况出现偏差。随着新型数据分析技术的发展,现有疾病传播模型的计算复杂度和数据处理能力也面临挑战。传统模型在大规模数据处理方面的局限性限制了其在大数据时代的应用。如何将海量数...……更多
一秒究竟有多长,中国光钟团队将有自己的答案
...确定度达到了1×10-16左右之后,再提高已经很困难了。 科学家想减小不确定度,就要寻找更高的跃迁频率。光学原子钟的跃迁频率在1014Hz以上,超过微波钟4个量级,具有巨大的发展潜力。早在1973年,就有人提出过采取光学频...……更多
限定120分钟科研挑战,o1和Claude表现超越人类
...情是这样的——人类 VS AI科研能力大比拼,也有新的评估基准了。代号“RE-Bench”,由非营利研究机构METR推出,目的是搞清:当前AI智能体在自动化科研方面有多接近人类专家水平。注意看,一声令下之后,AI和50多位人类专家开...……更多
李德仁:苍穹之上,擦亮“东方慧眼”
...力等详细数据,完成了最精细的三维数字高程模型。根据数据分析结果,他们认为唐家山堰塞湖虽险,但依然是稳固的,可以用明渠导流的办法排除风险。团队将这些数据呈报给抗震救灾指挥部,为正确处置险情提供了科学依据...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...不过,这种解读也引来了一些争议。比如,Meta FAIR 研究科学家主任田渊栋指出,论文采用的评估方法 ——「blitz」可能存在一些局限。「blitz」字面意思是闪电战,在国际象棋中指超快棋。在这种棋赛中,对局每方仅有几分钟的...……更多
开启精准医疗的“钥匙”
...提速的人工智能应用,还将鼓励生物学家、医生、计算机科学家和数据科学家之间更紧密的合作,从而推动跨学科研究的发展。 ……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... 支持多种开、闭源对齐评估:支持了 30 多个多模态评测基准,包括如 MMBench、VideoMME 等多模态理解评测,以及如 FID、HPSv2 等多模态生成评测训练框架北大对齐小组设计了高度模块化、扩展性以及简单易用的对齐训练框架,支持...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...和偏好调优,该研究还创建了 OLMoE-1B-7B-INSTRUCT,它在常见基准 MMLU、GSM8k、HumanEval 等上超越了各种更大的指令模型,包括 Llama2-13B-Chat 、OLMo-7B-Instruct (0724) 和 DeepSeekMoE-16B。受控实验强调了……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...左)和Gemini(右)的成绩。来源:X随后,谷歌DeepMind首席科学家杰夫·迪恩(JeffDean)在X平台上的一处讨论中对这个质疑作出了回应,写道:“我们报道了这两种方法。我们认为让社区看到我们新开发的CoT方法、并了解它与其他...……更多
AI诊断抑郁症,准确率高达97.53%的秘诀何在?
...新的、更客观的诊断方法,希望将来大家都能用得上。”科学家们发现,虽然以前很多抑郁症诊断研究都是只看一种数据,但这种新的多模式方法能够更全面地了解一个人的情绪状态。 结合语音和大脑活动数据后,这个模型在...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...AI应用场景的契合度。这一点,也是全球唯一的AI/ML存储基准测试——MLPerf所关注的本质。MLPerf存储基准测试面向AI/ML用户的痛点,即存储和计算的平衡及两者的有效利用。然而测试中存储架构的多样与存算节点的非标准化,导致...……更多
谷歌AlphaFold 3在《自然》杂志刊登:准确率超50%
...洛斯·阿拉莫斯国家实验室研究员、新墨西哥州联盟高级科学家ThomasC.Terwilliger在去年11月发表于《自然》杂志上的论文中称,尽管AlphaFold的预测并非全部准确,但其提供了可信的假说,可以用作提示机制。所有这些能力很可能只...……更多
硅谷大模型“价格战”上演,一味“卷”价格会有未来吗?
...以来,硅谷各大模型的能力正在趋同。LiquidAI的机器学习科学家MaximeLabonne在X平台上表示,表现最好的闭源模型(GPT-4级别)和开源模型在性能上的差距正在越来越小。图片来源:X平台与此同时,随着企业对定制化大模型的需求...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...LLM)训练工作负载的速度提高了两倍。”谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)写道,“对机器学习框架(JAX、PyTorch、TensorFlow)和编排工具的强大支持使我们能够在v5p上更高效地扩展。通过第二代SparseCores,我们还看到嵌...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...程对于 LLM 的输出结果,现在已经有了很多标准化的评估基准和机制。以代码生成为例:可以通过在编译器或解释器中运行代码来检查语法错误和功能,从而即时评估生成的代码的准确性。通过测量成功编译的代码所占的百分比...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...过人类时,AGI的未来变得更加明朗」。来自艾伦研究所的科学家Nathan Lambert对这个视频,做了一个精彩亮点的总结。一共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1...……更多
他汀立新功!研究发现:这3种他汀,能精准清除血管内皮衰老细胞
...是高血脂患者的主要控制手段之一。但随着研究的进步,科学家通过实验发现他汀的作用被低估,除了降脂以外,他汀可能还还有其他健康益处。一、多项权威研究发现,他汀不只是降脂!维也纳医科大学的Johannes M. Breuss 教授...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
...有了它,我们只需给需求,这个助手就能自己跑完探索性数据分析(EDA)、数据预处理、特征工程、模型训练,模型评估等步骤。当然,除了本文将重点提到的DS Assistant,它背后的Modelscope-Agent框架也值得说道。这个框架由阿里...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...过不断增加上下文长度(干扰图片的数量),将现有的VQA基准和简单图像识别集 (MNIST) 扩展为测试长上下文「提取推理」的示例。结果在简单VQA任务上,VLM的性能呈现出惊人的指数衰减。——LLM:原形毕露了家人们。而与实际研...……更多
开辟内地与澳门科技创新合作新模式(科技视点)
...航天工程项目,如探月工程、天问一号火星任务等,进行数据分析和相关研究工作。2018年7月,在各方支持下,我们还成立了月球与行星科学国家重点实验室,这些都为‘澳门科学一号’卫星的研究奠定了坚实的科学基础。”张...……更多
OpenAI安全优先级下降引担忧,多名高管离职
...I董事会成员BretTaylor、AdamD’Angelo和NicoleSeligman,以及首席科学家JakubPachocki、OpenAI早期筹备团队的AleksanderMadry、安全系统负责人LilianWeng、安保负责人MattKnight和“人工智能对齐”(AIAlignment)负责人JohnSchulman……更多
AI领域将面临数据墙:高质量语言数据枯竭 可能减缓训练进展
...发展的重大瓶颈。然而,面对这一看似绝望的局面,部分科学家却持有更为乐观和宽广的视角。他们认为,断言“人工智能模型正步入数据枯竭的绝境”过于悲观且片面。在语言模型的细分领域内,仍有一片未被充分探索的数据...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...千呼万唤中面世。△图源:谷歌一个月前,英伟达的资深科学家Jim Fan就为Gemini捏了把汗:“人们对谷歌Gemini的期望高得离谱!”他表示,Meta要惊艳世界的话,只要让Llama 3开源就好了。但谷歌想要重夺当年AlphaGo的辉煌,Gemini不...……更多
DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题
...程来描述。上世纪20年代,量子力学的相关规则出现后,科学家们第一次可以用详细理论描述化学反应的最底层原理。比如,对不同分子建立相应方程,求解系统的能量,就可以找出哪些分子处于稳定态,哪些分子间会自发地发...……更多
中国信通院何宝宏:数据治理发展趋势
...、安全、连通性对业务本身至关重要。另一方面企业通过数据分析技术,将业务沉淀的数据加工成为信息、知识甚至是智慧,以辅助提升企业的决策能力,驱动下一轮的经营行为。经过多年发展,一些头部机构基本实现了业务在...……更多
更多关于科技的资讯:
CBD 新地标:Z3,未来办公引擎登场
北京,2025年9月24日——北京 CBD 核心区再添重磅力作!今日,备受瞩目的 Z3 超甲级写字楼项目正式揭开神秘面纱
2025-09-25 13:43:00
中国电信-海信日立联合实验室揭牌,共筑智慧家电产业新高地
9月19日,中国电信山东公司、天翼物联科技公司与青岛海信日立在青岛举行联合实验室揭牌仪式,标志着三方战略合作迈入全方位深度融合的新阶段
2025-09-25 13:43:00
2025云栖大会直击:云深处科技机器人矩阵亮相,多场景展示行业引领性!
9月24日至26日,全球云计算与 AI 领域年度旗舰盛会 ——2025 云栖大会在杭州云栖小镇盛大启幕。本届大会以“云智一体・碳硅共生”为核心主题
2025-09-25 13:44:00
为落实《个人征信电子授权安全技术指南》(JR/T 0299—2024)金融行业标准,规范金融机构在个人征信电子授权中的技术操作
2025-09-25 13:44:00
文玩新经济浪潮奔涌,2025全国文玩大会重塑行业生态与消费图景
秋意渐浓,北京迎来一场文玩行业盛会。9月24日至28日,以“国潮觉醒 文玩新生”为主题的2025全国文玩大会于潘家园市场(西区)盛大举行
2025-09-25 13:46:00
如今,微短剧已然从“内容新贵”成长为拉动数字经济的重要力量。因为“轻、快、密”的内容节奏,短剧得以迅速占领用户的碎片时间
2025-09-25 13:46:00
三榜齐登、实力认证!网易有道连续五年入选“北京民营企业百强”
日前,北京市工商联、通州区人民政府联合召开2025北京民营企业百强发布会。会上,网易有道凭借持续的创新能力和稳健的业绩表现
2025-09-25 10:06:00
济南爱尔眼科实施全国首批龙晶PR型有晶体眼人工晶状体植入术
近日,首批龙晶PR型有晶体眼人工晶状体植入手术在济南爱尔眼科医院完成,作为“尝鲜吃螃蟹”的人,患者脸上洋溢着发自内心满意的微笑
2025-09-25 11:20:00
观赛有了更佳的趣味性与沉浸感金科院数字科技赋能国际赛艇大赛南报网讯(通讯员陆慧记者姜静实习生黄佳琪)2025南京·大学生国际赛艇公开赛近日在外秦淮河畔举行
2025-09-25 07:38:00
提升“双盲”模式下的评标质效雄安新区面向评标专家智能问答系统正式上线河北日报讯(见习记者康晓博)只需轻点鼠标,远在外地的评标专家就能获得精准指引
2025-09-25 07:58:00
大模型算出爆款,红枣变致富“金枣”
大模型算出爆款,红枣变致富“金枣”——看沧县红枣及干坚果食品加工产业如何实现数字化转型9月18日,河北华聚食品有限公司的工人忙着打包红枣产品
2025-09-25 07:59:00
9月17日,兴业银行信用卡中心与美团企业版在上海签署战略合作协议,共同打造“金融+生活”开放生态。根据协议,双方将基于开放共享
2025-09-24 07:24:00
金洽会上51个重点产业项目签约,计划投资802.21亿元——一串串数字,见证企业对南京的高度认可□南京日报/紫金山新闻记者张甜甜9月23日
2025-09-24 08:11:00
5项科技创新成果案例发布芯片设计迎“超强大脑”多癌早筛一管血“搞定”南报网讯(记者张安琪)9月23日,2025南京金洽会开幕式重点发布环节
2025-09-24 08:12:00
在今年国庆、中秋双节消费旺季来临之际,济南122站以“客户体验感”为核心,从“环境优化、商品管理、客户拓展”三大维度精准发力
2025-09-24 08:50:00