• 我的订阅
  • 头条热搜
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...制版本提供支持,该版本经过专门优化,适配网页浏览和数据分析场景。它能够运用推理能力,在互联网上搜索、解读和分析海量的文本、图像和PDF文件,并能根据所遇到的信息灵活调整研究方向。 值得注意的是,在对这个智...……更多
人工智能训练师与数据科学家的区别
...主要职责是从数据中提取有价值的洞察和信息。他们通过数据分析和统计方法,发现数据中的模式和趋势,以支持决策制定。数据科学家通常需要具备强大的统计学知识和编程能力,熟练使用工具如Python、R、SQL等。他们的工作...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...正的科学研究需求。 而苹果这次竟然来真的!!就连NLP科学家、AutoAWQ创建者也发出惊叹:Apple发布了一个击败Mistral 7B的模型,但更棒的是他们完全开源了所有内容,包括预训练数据集也引来网友在线调侃:至于这次开源的意义...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...化的微调模型。在开源社区掀起一阵热议,HuggingFace首席科学家Thomas Wolf墙裂推荐并总结了几个亮点。数学能力很强 用了很多精心制作的合成数据 深入探索了MoE训练,使用共享专家、总结了MoE的Scaling Law。 各路开发者中,有立...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...-4o开刀,去解决动物过河难题。在此,他给出了一个新的基准——废话比率(crapness ratio),即LLM给出的总答案与正确答案之间的比率。经过测试,Gowers发现大模型的废话比率可以达到5倍。一开始,他先给出了一个农民带2只鸡...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...分布的变量:四、关键实验及分析1.1 训练数据集与测试基准我们分别采用 MS1MV2 (5.8M 图像,85K 类别),Glint360K (17M 图像,360K 类别) 以及 WebFace42M (42.5M 图像,2M 类别) 作为我们模型的训练集。利用 LFW, AgeDB-30, ……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
....5 倍(如图 5 所示)。数据集评估本文在一系列标准学术基准测试中评估 Conba 性能,包括常识推理任务(如 HellaSwag、WinoGrande、ARC - E、ARC - Challenge)、阅读理解任务(如 BoolQ、QuAC)、聚合基准测试(如 MMLU、BBH),采用不同……更多
...体概念股掀涨停潮。在Manus官网上的视频中,其团队首席科学家季逸超演示了Manus的功能,譬如用Manus筛选简历,筛选纽约房产并生成详细报告,或者进行股票相关分析。Manus可通过API获得权威数据,然后自动编写代码对数据进行...……更多
...进展,特别奖励将高性能计算应用于科学、工程和大规模数据分析的创新。奖项可能会授予在可扩展性和解决重要科学与工程问题时间方面的最高性能或特殊成就,表彰高性能计算应用领域所取得的杰出成果。2023年戈登·贝尔奖...……更多
最新美国国家人工智能科学院院士介绍
...纽约大学。她专注于机器学习理论和应用,特别是在高维数据分析和统计推断方面。Ward的研究为机器学习模型的可解释性和稳健性提供了理论支持,为解决实际问题提供了更加可靠的方法。FedericoPinzi,来自麻省理工学院。他在...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与...……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...论文地址:https://arxiv.org/abs/2410.10934v1研究人员提出了DevAI基准,为全新框架提供概念验证测试平台。包含55个真实的AI开发任务,带有详细的手动注释。通过对三个领先的智能体系统进行基准测试,发现它大大优于「LLM-as-a-Judge」...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...entGoogle DeepMind:利用运动轨迹控制视频生成大模型数学新基准:成功率最高 2%Meta 推出「高效追踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
医渡科技协办第四期CDO研讨活动召开,推进数字医疗安全建设
...附属医院信息中心主任周敏,医渡科技 CTO、首席人工智能科学家闫峻,华为上海政企医疗行业CIO朱紫筵,华为数据保护首席架构师孙思远。国家卫生健康委员会统计信息中心副主任胡建平、上海市卫生健康统计中心书记、主任陈雯...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...了新颖的视觉条件 3D 生成框架。 他们在单一和稀疏重建基准上进行的数值和视觉比较表明,See3D 在经济高效且可扩展的视频数据上经过训练后,实现了显著的零样本和开放世界生成能力,明显优于在昂贵且受限的 3D 数据集上...……更多
...等前沿技术的广泛应用,服务器应用场景日益丰富,从大数据分析到深度学习模型训练,任务类型日趋多样化。与此同时,降低能源成本和数据中心碳排放的压力不断增加,服务器能效提升成为必然趋势,从而引导服务器厂商提...……更多
...异会导致模型的预测结果与实际情况出现偏差。随着新型数据分析技术的发展,现有疾病传播模型的计算复杂度和数据处理能力也面临挑战。传统模型在大规模数据处理方面的局限性限制了其在大数据时代的应用。如何将海量数...……更多
“AI+数据”护肤时代来临!瑷尔博士“叩门”智能护肤时代
...理想皮肤数据库,用于建设“IdealSkin Match”这一理想皮肤数据分析平台。目前,该数据平台涵盖超过960万条高质量面部菌群基因序列(样本平均约40,000条,序列长度416–559 bp)、1.9万余项(每位志愿收集80+项皮肤生理参数指标)...……更多
一秒究竟有多长,中国光钟团队将有自己的答案
...确定度达到了1×10-16左右之后,再提高已经很困难了。 科学家想减小不确定度,就要寻找更高的跃迁频率。光学原子钟的跃迁频率在1014Hz以上,超过微波钟4个量级,具有巨大的发展潜力。早在1973年,就有人提出过采取光学频...……更多
游戏bug帮大模型学物理!准确率超GPT4o近4个百分点
...识的大型视频语言模型PhysVLM,开源了!它不仅在 PhysGame 基准上展现出最先进的性能,还在通用视频理解基准上(Video-MME, VCG)表现出领先的性能。在这项研究之前,想让AI像人类儿童一样,通过观察世界理解基本的物理常识,是...……更多
全球首个!西电“玄知”密码大模型问世!
...源。西安电子科技大学同步发布全球首个密码学专业测评基准 CryptoBench,填补领域空白。该基准覆盖 密码算法/协议/工程三大板块、12个核心方向、74个细分领域,包含 10,000+道精编题目,实现能力边界精准探测。建立版本迭代流...……更多
李德仁:苍穹之上,擦亮“东方慧眼”
...力等详细数据,完成了最精细的三维数字高程模型。根据数据分析结果,他们认为唐家山堰塞湖虽险,但依然是稳固的,可以用明渠导流的办法排除风险。团队将这些数据呈报给抗震救灾指挥部,为正确处置险情提供了科学依据...……更多
限定120分钟科研挑战,o1和Claude表现超越人类
...情是这样的——人类 VS AI科研能力大比拼,也有新的评估基准了。代号“RE-Bench”,由非营利研究机构METR推出,目的是搞清:当前AI智能体在自动化科研方面有多接近人类专家水平。注意看,一声令下之后,AI和50多位人类专家开...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...表现究竟能有多强大呢?根据OpenAI的介绍,o3模型在ARC-AGI基准上获得了破纪录的分数。ARC-AGI由Keras之父Fran ? ois Chollet开发,主要是通过图形逻辑推理来测试模型的推理能力。以100%为最高分的ARC-AGI评估结果显示,在低计算场景中...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...不过,这种解读也引来了一些争议。比如,Meta FAIR 研究科学家主任田渊栋指出,论文采用的评估方法 ——「blitz」可能存在一些局限。「blitz」字面意思是闪电战,在国际象棋中指超快棋。在这种棋赛中,对局每方仅有几分钟的...……更多
开启精准医疗的“钥匙”
...提速的人工智能应用,还将鼓励生物学家、医生、计算机科学家和数据科学家之间更紧密的合作,从而推动跨学科研究的发展。 ……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... 支持多种开、闭源对齐评估:支持了 30 多个多模态评测基准,包括如 MMBench、VideoMME 等多模态理解评测,以及如 FID、HPSv2 等多模态生成评测训练框架北大对齐小组设计了高度模块化、扩展性以及简单易用的对齐训练框架,支持...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
...和偏好调优,该研究还创建了 OLMoE-1B-7B-INSTRUCT,它在常见基准 MMLU、GSM8k、HumanEval 等上超越了各种更大的指令模型,包括 Llama2-13B-Chat 、OLMo-7B-Instruct (0724) 和 DeepSeekMoE-16B。受控实验强调了……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...左)和Gemini(右)的成绩。来源:X随后,谷歌DeepMind首席科学家杰夫·迪恩(JeffDean)在X平台上的一处讨论中对这个质疑作出了回应,写道:“我们报道了这两种方法。我们认为让社区看到我们新开发的CoT方法、并了解它与其他...……更多
更多关于科技的资讯:
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00
12月12日“双十二”购物节当天,西湖区黄龙国际中心K-lab广场人气高涨,“疯狂碰友日·西湖首发季”2025西湖区新消费活动在此启动
2025-12-16 08:30:00
为加快培养适应人工智能时代发展需求的高水平创新人才,10月底,《浙江省中小学人工智能通识教育指导意见》发布。此前,杭州将人工智能通识课程纳入中小学各学段地方课程
2025-12-16 08:31:00