• 我的订阅
  • 头条热搜
面壁智能发布开源大模型eurux-8x22b
5月3日消息,面壁智能发布开源大模型Eurux-8x22B,包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO,主打推理能力。官方测试中,Eurux-8x22B 在 LeetCode(180道LeetCode编程真题)与 TheoremQA(IT之家注:美国大学水准的STEM……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
引言:MaaS(ModelasaService,模型即服务)是一种将人工智能算法模型及其相关能力封装成服务,以降低人工智能技术使用门槛、控制应用建设成本、简化系统运维管理复杂度,并提升人工智能技术的综合应用效能的模式。 上新了...……更多
面壁智能发布2B模型:适配主流手机,推理成本仅为GPT-4的1/360 | 最前线
文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地,运行成本就成为各厂商的现实考量。将模型做小,成为现实市场需求下的趋势。但模型的Scaling Law(规模定律)已指出,参数规模是决定模型性能的最关键因素。如何用更小的参...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...,揭示了当前人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...二,据知名科技商业类媒体The Information援引多位测试过该模型的人士透露,站在时代风口浪尖的“AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比,雄心勃勃地宣布进入“Gemini时代”,更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
...6月4日报道,以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
继旗下xAI公司宣布正式开源大模型Grok-1后,特斯拉CEO马斯克再次在大模型市场扔下一颗重磅炸弹。当地时间8月11日晚,马斯克在X平台上透露人工智能模型Grok-2测试版将在不久后发布。事实上,马斯克在7月份就在X平台上确认,Gr...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推理任务而...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
马斯克突然发布Grok-2!数学推理能力突出,攻克“9.9与9.11比大小”经典难题
...北京时间8月14日下午,xAI正式官宣Grok-2和Grok-2 mini两款AI模型(测试版)。xAI直接揭秘,前一阵子出现在Lmsys大模型竞技场上的神秘模型“sus-column-r”就是Grok-2。在xAI给出的大模型排行榜中,Grok-2的评分优于GPT-4o-mini和Claud……更多
商汤科技与金山办公达成商业合作,“日日新”大模型补强办公软件理科大脑
...公生产力大会上,金山办公展示了携手商汤科技等国内大模型厂商打造的办公平台WPS365。商汤“日日新”大模型凭借其卓越的代码生成及工具调用能力助力WPS365打造更高效释放场景能力的智能办公平台。最强理科能力!商汤“日...……更多
...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3,继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
第一个100%开源的MoE大模型,7B的参数,1B的推理成本
... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展,但在训练和推理方面,性能和成本之间仍然需要权衡。对于许多学者和开发人员来说,高性能的 LM 是无法访问的,因为它们的构建...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...技术优势:它支持智谱 AI、百川智能等国内领先的大语言模型,通过微调和优化提高模型的准确率和可读性,通过开放 API 接口支持个性化的数据应用搭建。(来源:“CSDN”微信公众号)《马斯克多次失手,OpenAI 异军突起,硅...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的研究已经表明,大模型表现出一...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日,在2024商汤技术交流...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模...……更多
李飞飞空间智能之后,上交、智源、北大提出空间大模型SpatialBot
...成绩在东南大学取得学士学位。他的研究兴趣为多模态大模型、具身智能。此工作为其在上海交通大学访问和北京智源人工智能研究院实习期间完成,导师为本文通讯作者赵波教授。此前,李飞飞老师提出了空间智能 (Spatial Intel...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最简单的题目上竟然做错了,甚至网友们发现,就连Claude 3.5也无法幸免。在经典的「狼-山羊-卷心菜」过河问题上,如今所有的LLM都失败了!几天前,菲尔兹奖得主...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
更多关于科技的资讯:
近日,在江苏常州220千伏淦西变电站与220千伏永和变电站,国网常州供电公司二次检修人员利用自主研发的“变电站站间电流互感器一次通流同步测试仪”
2025-12-17 23:18:00
AI 工具赋能品牌:开启全新增长引擎
因为Deepseek的流行,2025年被称作中国AI智能体元年。在这股AI浪潮之下,许多品牌建设者是既兴奋又焦虑,兴奋的是新变革意味着新机遇
2025-12-17 08:09:00
2025“平安财萌杯”全国总决赛在深落幕,携手11万大学生共赴财商成长之约
近日,2025“平安财萌杯”大学生财经素养大赛全国总决赛在深圳平安金融中心圆满举行。本届大赛自8月启动以来,共吸引了来自清华大学
2025-12-17 08:39:00
鲁网12月16日讯近日,经过数月的精心筹备,建行泰安分行营业部成功举办首场“商叶云贷”专题直播推介会。本次活动精准覆盖全市19000户烟草零售商户
2025-12-17 09:24:00
东南网12月17日报道(福建日报记者 黄星榕)买了乐高等大型积木却没有时间和耐心拼装,想吃家常菜却苦于时间不够、厨艺不精
2025-12-17 14:02:00
《威图可再生能源行业解决方案》发布:严苛环境下的设备应用指南
从零下45℃的严寒到零上50℃的炙烤,从沙漠风沙到海上盐雾……在能源转型的浪潮席卷全球之际,中国可再生能源产业正以令人瞩目的速度发展
2025-12-17 14:11:00
4000+工程师竞技收官,第三届威图卓越工程师大赛圆满落幕
在智能化浪潮持续重塑工业格局的今天,人才的系统化能力与创新思维已成为驱动产业升级的核心要素。作为全球控制柜与开关柜智能制造领域的领导者
2025-12-17 14:11:00
捷翼科技:继往开来,智造全球汽车核心部件
在吉林省创新创业的热潮中,有一家名为长春捷翼汽车科技股份有限公司(以下简称捷翼科技)的企业,15年里,在周立新与王超母子的接力下
2025-12-17 23:03:00
大窑饮品2025产品战略解码:多元矩阵开辟增长新路径
鲁网12月17日讯2025年的饮品行业,已告别盲目的“流量争夺”和“数量竞赛”,转向对消费需求的精准洞察与价值锚定。面对需求分层
2025-12-17 14:19:00
为推进降本增效,人保财险江苏泰州市分公司聚焦支付渠道优化,通过系列举措降低微信收款占比,成效显著。公司构建“宣导+流程+考核”三位一体体系推进工作
2025-12-17 15:15:00
为破解传统车险报价慢、信息不透明等痛点,人保财险江苏泰州分公司上线“智能报价机器人”与“AI报价解读官”,以科技实现车险服务提质增效
2025-12-17 15:15:00
滨州联通打造全链条自主可控政务云平台 赋能数字政府建设
鲁网12月17日讯为响应国家“自主可控、安全可靠”战略号召,贯彻落实各级政府加快推进国产化自主可控替代计划,近日,滨州联通全力打造全链条自主可控政务云平台
2025-12-17 15:31:00
花粉探秘华为黑科技:AI影像与智慧交互开启未来体验
12月16日下午,花粉走进华为智能生活馆·曲江创意谷店,参与“华为黑科技体验日”沙龙活动,深度体验Mate80系列、MateX7折叠屏
2025-12-17 15:33:00
全球唯一!常州企业撬动掌上终端百亿市场
当你用手机向DeepSeek发送文本生成指令,或是借助短视频AI模板制作创意视频时,手机芯片的功耗常会骤升至平时的2.5倍以上
2025-12-17 16:07:00
随着社会快速发展和竞争压力持续增大,青少年心理健康问题日益凸显,已成为一项全球性的重大公共卫生挑战。据2025年发表于《柳叶刀-区域健康(西太平洋)》的研究显示
2025-12-17 16:19:00