• 我的订阅
  • 头条热搜
OpenAI 再成“榜一大哥”:o1-preview AI 模型驾驭数学等任务
...报道称在聊天机器人竞技场(Chatbot Arena)上,OpenAI 的新人工智能模型 o1-preview 和 o1-mini 问鼎榜首。聊天机器人竞技场简介聊天机器人竞技场是一个比较人工智能模型的平台,它利用 6000 多个社区评分对新的 OpenAI 系统进行了评...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...在有点小儿科了,有些任务的性能都甩了人类一截。通用人工智能(AGI)的一个重要特点是模型具有处理人类水平任务的泛化能力,而依赖于人工数据集的传统基准测试并不能准确表示人类的能力。最近,微软的研究人员发布了...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...数据进行训练,以能够自然地理解和生成自然语言文本的人工智能模型。这些模型可以用于自然语言处理任务,如文本分类、文本生成、语言翻译、问题回答和摘要生成等。最近几年,由于深度学习技术的进步,大型语言模型已...……更多
...分,数学全不及格”的消息登上“热搜”。消息出自上海人工智能实验室旗下司南评测体系OpenCompass对7个开源大模型进行的高考语、数、外全卷能力测试。据OpenCompass于6月19日发布的评测结果,大模型的语文、英语考试水平还不...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...国公司的进步速度太快了!在推理中自我反思、纠正上海人工智能实验室(上海AI实验室)今年7月发布的书生·浦语2.5已经实现了开源模型中领先的推理能力,而InternThinker则使大模型的推理能力再上新台阶。团队表示,在OpenAI o1...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...至少在某些条件下,o3模型可以接近实现AGI。AGI是“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...周末,摩根大通 CEO 杰米・戴蒙(Jamie Dimon)表示,由于人工智能技术,未来几代人每周可以只工作三天半,活到一百岁。一些研究认为,生成式 AI 等技术可以让目前占用人们工作时间 60-70% 的任务实现自动化。这些变革需要的...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com上海交通大学生成式人工智能实验室 (GAIR Lab) 的研究团队,主要研究方向是:大模型训练、对齐与评估。团队主页:https://plms.ai/AI技术日新月异,近来Anthropic公司最新发布……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座”研发团队介绍说,“双子座”是谷歌迄...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...AI宠儿”OpenAI计划在未来两周内发布名为“草莓”的最新人工智能产品,作为ChatGPT所提供服务的一部分。这比两周前传闻的“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些...……更多
...分辨率高精度天气预报,通过设计机理与数据融合驱动的人工智能算法,实现对未来48小时多气象变量的逐小时滚动预报。心理健康应用模型是全国首款多模态交互式情感语言应用模型,在30多个国家语料库的基础上,应用TTS、AS...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...决方案所取代。本文,来自不列颠哥伦比亚大学、非营利人工智能研究机构 Vector Institute 等的研究者制定了一个新的研究领域,即智能体系统的自动化设计(ADAS,Automated Design of Agentic Systems),并提出了一种简单但有效的 ADAS 算...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...何联合理解和生成跨多种模式的信息,也被视为朝向通用人工智能的下一个步骤。根据此前媒体报道,阿里国际在去年成立了一支AI团队,目前已经在40多个电商场景里测试了AI能力,覆盖跨境电商全链路,包括商品图文、营销、...……更多
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...12天12场直播收官,离AGI(artificial general intelligence,通用人工智能)似乎又更近了一步。当地时间12月20日,和网友猜测的一样,人工智能(AI)巨头OpenAI发布最新推理模型o3和o3-mini。前一天,OpenAI公司CEO山姆·奥特曼(Sam Al……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...动创建大量、多样化的合成数据。经过合成数据微调后的模型Orca-3,在多项基准上刷新了SOTA。全世界高质量数据几乎枯竭。AI科学家们为了解决这一难题,可谓是绞尽脑汁。目前来看,合成数据或许就是大模型的未来,也成为业...……更多
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
...回答,引发掌声不断。刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现“智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。他进一步公布大模型年内三...……更多
...、3、ChatGPT和GPT-4)开发思路来看,这家美国企业在向着通用人工智能商用目标迈进。与ChatGPT相比,GPT-4离商用产品又进了一步。这种进步包括:在应对政治敏感、违反伦理或法律的指令和问题时,GPT-4表现得越发成熟和安全。一些体验...……更多
...智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比上一个版本V2.5模型提升3倍,达到每秒...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...模型,同时最大限度地降低数据污染的风险。目前的 SOTA 人工智能模型只解决了不到 2% 的问题,这揭示了人工智能能力与数学界实力之间的巨大差距。论文链接:https://arxiv.org/abs/2411.04872Meta 推出「高效追踪一切」模型 SAM 2 已...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...正式发布,在数学能力、代码能力上超过了GPT-4o。由艾伦人工智能研究所、OpenAI等国内外权威单位发布,涵盖理解和推理、综合考试、数学和科学、代码等不同任务类型的14项主流测试集中,讯飞星火4.0-Turbo在其中9项测试集中实...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI...……更多
超越国际标准!中国电信AI大模型发布:解决九章算术难题
快科技1月25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。在多项权威评...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...用成果。刘庆峰在现场演讲中表示,ChatGPT在全球引起了人工智能的全新的浪潮,各行各业都在拥抱这个巨大的变革和机会,传统意义上通过堆时长、堆人力的商业模式将被根本性的颠覆。他提到,当前对通用人工智能系统的需...……更多
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...值得持续关注。认知大模型展现出的智能涌现推动了通用人工智能的技术阶跃。微软研究院曾发表过一篇名为《通用智能的星星之火》的论文,列举分析了GPT-4的多种能力,可以看出模型和数据都是可行的;ChatGPT发布时就公布了...……更多
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
来源:硬AI圣诞节前,人工智能巨头上演了一场精彩的推理模型攻防战。谷歌和OpenAI正面对垒,谷歌刚发布自家的先进推理模型挑战OpenAI的o1,第二天,OpenAI就推出了升级版的最强推理模型o3。美东时间12月20日周五,在为期12个...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...但对于复杂的推理任务来说,这是一个重大进步,代表了人工智能能力的新水平。鉴于此,OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1。重点在于,OpenAI 的大规模强化学习算法,教会模型如何在数据高度有效的训练...……更多
...参考消息参考消息网6月12日报道 据法新社6月4日报道,以人工智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
... AI 之战十年前已经打响》Facebook、微软和百度如何加入了人工智能的人才争夺战:通过收购和投资人工智能初创公司,例如,谷歌收购了DeepMind、Facebook收购了Oculus VR,微软收购了Nuance,百度收购了Face++等;建立本地化的人工智...……更多
更多关于科技的资讯:
阿里1688宣布已接入DeepSeek:所有面向商家的AI全部免费
快科技2月10日消息,今天,阿里巴巴旗下1688在京启动了招商活动,并宣布所有面向商家的AI产品全部免费。比如新推出免费的AI数字员工
2025-02-10 18:17:00
中国消费者报北京讯(记者杜科)2月8日,希沃学习机全系产品接入DeepSeek大模型。目前,希沃学习机W系列、T系列、V系列等产品均能够使用包括DeepSeek在内的多种大模型能力
2025-02-10 18:33:00
曝哪吒2被越南人盗摄翻译上传外网 出品方:会努力处理
快科技2月10日消息,国产动画电影《哪吒之魔童闹海》正在热映中,截至目前累计票房已超83亿人民币,中国影史第一,放到世界范围内
2025-02-10 18:47:00
二手矿卡摇身一变成新卡!揭秘商家的那些无良操作
显卡价格居高不下,让不少游戏玩家犯了难,开始寻求性价比更高的显卡,也给了矿卡可乘之机。许多萌新玩家在不知情的情况下,成为了矿卡的“接盘侠”
2025-02-10 18:47:00
十三连冠!格力中央空调市场占有率稳居第一
快科技2月10日消息,2024年,格力中央空调实现了自2012年以来连续13年市场占有率第一的佳绩,成市场份额唯一突破15%品牌
2025-02-10 18:47:00
机械革命极光X游戏本发布:新一代铝合金机身 首发6599元
快科技2月10日消息,极光X新款游戏本现在发布上架,酷睿i7-13700HX、RTX 4060显卡,首发6599元。极光X游戏本采用了新一代高等级模具
2025-02-10 18:47:00
技嘉RTX 5080超级雕显卡评测:外挂风扇强化散热 四风扇烤机仅60度
一、前言:一看就很超级的技嘉RTX 5080超级雕来了NVIDIA推出的RTX 50系显卡,把AI图形技术带到全新的高度
2025-02-10 18:47:00
努比亚/红魔将接入DeepSeek R1:6710亿参数满血嵌入系统
快科技2月10日消息,今日,努比亚和红魔游戏手机官方都宣布,旗下手机将接入DeepSeek R1。中兴通讯终端事业部总裁
2025-02-10 18:47:00
16GB梦碎!RTX 5060显存抠唆还是8GB
快科技2月10日消息,最近网上有曝料公布了号称是索泰RTX 5060 Ti、RTX 5060的包装盒设计,赫然可以看到显存容量都是16GB
2025-02-10 18:47:00
Arm CEO评价DeepSeek:确实令人意外 但最终可能会被关闭
快科技2月10日消息,据媒体报道,Arm CEO Rene Haas在接受采访时表示,DeepSeek的出现确实令人意外
2025-02-10 18:47:00
雷军宣布元宵节在小米食堂直播:带大家云体验小米员工餐
快科技2月10日消息,雷军今天宣布,将在本周三晚上7点做一场元宵节直播,和大家一起共度元宵佳节。他还透露,这次将在小米食堂边吃边聊
2025-02-10 18:47:00
最新!DeepSeek获顶级域名认可
2月10日,记者注意到,现在在浏览器输入ai.com,可以直接定向至DeepSeek官网。图源:“长安街知事”微信公众号根据域名信息服务平台的公开数据
2025-02-10 18:49:00
《碟中谍8:最终清算》超级碗预告片发布:阿汤哥血肉之躯大战AI智体
快科技2月10日消息,今日,《碟中谍》系列新作《碟中谍8:最终清算》发布超级碗版预告,该片将于5月23日北美上映。影片由克里斯托夫·迈考利执导
2025-02-10 19:17:00
苹果独立AR眼镜计划不变!只是需要更长时间
快科技2月10日消息,前不久报道称,苹果取消了打造由Mac驱动的AR眼镜计划,这让外界猜测苹果的AR眼镜开发是否会像苹果汽车一样胎死腹中
2025-02-10 19:17:00
理想高管:今年肯定会发布纯电SUV
快科技2月10日消息,理想汽车整车电动产品负责人唐伯伯(唐华寅)在微博确认,理想汽车计划在今年推出纯电SUV车型。目前
2025-02-10 19:17:00