• 我的订阅
  • 头条热搜
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...请来了两位国产AI友情参赛(kimi和文心一言)。o1满血版实测体验并非「无敌」o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:假设一个公司生产某种商品,生产成本与产...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...波,不知道大家如何顶住。耐心等待的时间里,我们先来实测一下。一手实测体验与 OpenAI o1 相同的是,根据问题的复杂程度,它也需要「思考」数十秒后再回答。虽然有些过程中的思路在人类看来可能毫无意义,甚至是错误的...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文,支持20万长度的Kimi基本能理解指令要求,并就话题和观点、原文,在不到十多秒内就进行了输出。就此实测...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...然,Skywork o1 的成色如何,我们还是得看实战效果。一手实测这次 Skywork o1 彻底拿捏住了推理机器之心提前拿到了测试资格,对 Skywork o1 系列模型,尤其是 Lite 和 Preview 版本的推理能力进行了全方位的考察。下图为 Skywork o1 Lite ...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...。在多模态理解图文问答任务上,开闭源模型平分秋色,国产模型表现突出。国产多模态模型在中文语境下的文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明...……更多
全球都在搞AI,为什么是百度挣到钱?
...际产生价值”将成为所有人无法回避的难题。对此,作为国产大模型代表的百度,正在给出自己的答案。2月28日,百度2023年第四季度及全年财报正式发布。不仅业绩数据亮眼,在同日举行的业绩报告会上,百度创始人、董事长...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
...16、Mac系统和ios18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。受此影响,昨日百度港股直线拉升,午盘大涨6.42%,截至收盘涨幅回落至2.8%。而A股市场的大模型概念股则全...……更多
...搜”所说那样完全不及格,讯飞星火、阿里巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...实现难度,在全球范围内属于行业第一梯队水平。百度是国产大模型领导者,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力。在近日弗若斯特沙利文发布的《2024年中国大模型能力评测》...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...讯飞就与华为共同发布星火一体机,让所有企业都可以在国产自主创新平台上私有化部署大模型。一来,星火一体机基于星火认知大模型,针对污语料和幻觉问题,形成了“立体化”的内容安全机制。二来,星火一体机基于昇腾...……更多
“整活”保险业务,AI大模型哪家强?
一款款AI大模型横空出世,各行各业都在尝试下棋落子,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根...……更多
李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...司能有效地进行模型训练和推理,即使是使用性能较低的国产芯片仍能维持高效率。资料显示,虽然百度之前主要依赖于英伟达的AI芯片,但是百度也有自己的自研的XPU架构的AI芯片——昆仑芯,2021年7nm的昆仑2代芯片就已经量产...……更多
倒计时10天!百度世界2023五大亮点全剧透
...月发布以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
近日,OpenAI宣布,为了维护服务质量和安全性,7月9日起将采取额外措施来限制来自当前不支持的国家和地区的API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...彦宏在Create2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...主要角色介绍、情节分析、影响等角度列出概述大纲。在实测过程中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对财报中的财务数据进行解读,并按照财报叙述逻辑总结重点。除此之外,万知还可以...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
终于,国产大模型能在综合能力上也能与GPT-4o一决雌雄了。在12项指标的测试中,这个模型有11项都超过了GPT-4o,综合能力则高出了10个百分点。而且在诗词赏析等中文特色领域优势更加明显,“最难中文Benchmark”弱智吧也有重...……更多
文心大模型赋能千行百业,自主进化
...出世,各行各业的生产力似乎都将被AI大模型再次点燃。国产大模型的数量快速增长,截至10月,国内已发布238个大模型。尽管围绕AI大模型技术变革之力的讨论层出不穷,但行至今日,AI大模型技术的发展重点已然在于“如何赋...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
生成式AI慢人一步的苹果,选择与百度合作,是正确的选择吗?
...不是苹果第一次“落后”,比如充电功率过低、拍照不如国产旗舰机,标准版高刷的缺失等等,这几年在很卷的国产手机面前,苹果好像就剩下了一个“生态”的优势。苹果的落后不止一次,但这次不同。2023年以ChatGPT为代表的A...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...度在WAVE SUMMIT深度学习开发者大会2024上,正式发布文心大模型4.0 Turbo版本,其同步上线网页端和API接口,App端也将陆续上线。▲文心大模型4.0 Turbo API开放同时,飞桨平台发布新一代飞桨框架3.0 Beta版本,具备大模型训推一体、动...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...可以显著的性能提升,同时消耗更少的训练和推理资源。国产大模型上演「复联」,组队挑战「灭霸」o1360首创的CoE架构,不仅拉齐了国内公司和OpenAI的技术发展水平,还具有很强的现实应用价值。现在的国产大模型在数据、算...……更多
奥特曼晒“草莓”引热议 神秘新模型现身竞技场 网友第一波实测来了
...更显得“有理有据”了。新模型现身竞技场,网友第一波实测最早在昨天下午,有网友发现lmsys竞技场上多了个匿名新模型anonymous-chatbot。之前很多包括OpenAI在内很多科技公司都会发布前会进行一波测试。再加上它自称是GPT-4模型...……更多
李彦宏:进一步提升“文心一言”产品采用率
...度创始人、董事长兼首席执行官李彦宏透露,百度文心大模型推理成本已降至1%。李彦宏表示,自发布以来,百度不断降低文心大模型的推理成本,“文心一言”3.5版本的推理成本是3.0版本的1%。通过推理成本的不断降低,越来...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...3月,我国共有117个生成式人工智能服务完成备案,各类国产大模型,更是超过了200多个,多模态的大模型应用场景正在不断拓展。然而,随着大模型的快速发展,算力成本日益成为影响人工智能推广应用的重要因素,大模型产...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...火开源大模型——星火开源-13B。科大讯飞称,V3.5基于全国产化算力底座飞星一号”平台打造,是首个基于全国产化算力平台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多...……更多
李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大
9月11日消息,AI大模型经历了波澜壮阔大发展的2023年。2024年以来,全球基础大模型的更新速度均出现放慢,相伴随的,行业中各种质疑声音也开始涌现。“大模型之间的能力已经没有壁垒”、“还应该继续投入基础模型的研究...……更多
更多关于科技的资讯:
寒假里,南农大农业智能传感器与检测技术实验室里热火朝天猪猪戴“耳环”,健康状况尽在“掌”握□南京日报/紫金山新闻记者李花为了解生猪的健康情况
2025-01-23 07:54:00
□南京日报/紫金山新闻记者张安琪“如果用什么化来形容第四次工业革命,我认为是智能化。就是将智慧融入物理(实体)系统,将人工智能融入物理世界
2025-01-23 07:55:00
新年首场新宁商沙龙聚焦软件赋能 干字当头,蓄力冲刺首个“万亿产业”□南京日报/紫金山新闻记者江芬芬 通讯员于扬1月17日下午
2025-01-23 07:55:00
三星Galaxy S25 Edge官宣:超薄骁龙8至尊版旗舰 剑指iPhone 17 Air
快科技1月23日消息,在今天凌晨的三星Unpacked活动上,三星带来了Galaxy S25、Galaxy S25+和Galaxy S25 Ultra三款旗舰
2025-01-23 08:02:00
华为Mate XT对手来了!三星三折叠屏手机现身:Z形折叠
快科技1月23日消息,今天凌晨,三星举办Galaxy S25全球新品发布会,三星史上最强AI手机S25系列发布。作为发布会的最大彩蛋
2025-01-23 08:02:00
男子买三手车后竟要花4万5续费辅助驾驶 法院:原车主违约 要赔钱
快科技1月23日消息,据报道,智能网联电动车的辅助驾驶功能对车辆价值具有重大影响,而购买二手车时如何处理相关纠纷,法院近期披露了一起典型案例
2025-01-23 08:02:00
钟睒睒:互联网低价竞争摧毁中国经济 价格战是无能的表现
快科技1月23日消息,近日钟睒睒公开表示,互联网的低价竞争正在摧毁中国的质量,正在摧毁中国的经济。“没有价格哪来创新,没有价格的支撑
2025-01-23 08:32:00
第一批回家过年的人已经堵路上了:服务区也堵上了 都是车和人
快科技1月23日消息,随着春节假期临近,国内春运也逐步迎来了高峰期。公路客运作为春运的主力,堵车的压力也是直线上升。据报道
2025-01-23 08:32:00
特朗普第一个重大项目,马斯克公开打脸了
大戏已经开场,撕X正在进行时。1月21日,特朗普上台第二天,公布了自己的第一个重大项目。代号“星际之门”,投资5000亿美元
2025-01-23 10:28:00
真正的骁龙8至尊版小屏之王!三星Galaxy S25图赏
快科技1月23日消息,三星Galaxy S25正式发布,国行版尝鲜价是6499元,这是迄今为止最强悍的骁龙8至尊版小屏旗舰
2025-01-23 08:32:00
美国研发出新材料:可在流体与固体状态间自由切换
快科技1月23日消息,据报道,美国加州理工学院 Chiara Daraio 实验室的研究人员发现了一种新型材料,这种材料在应力作用下表现出独特的性质
2025-01-23 08:32:00
浙江日报讯 (见习记者 吴柯沁 通讯员 王新辉) 记者近日从丽水市市场监管局获悉,2024年丽水创新探索直播电商主体分级监管
2025-01-23 08:40:00
2025年3C产品购新补贴发放 厦门市民领取指南来了
厦门网讯(厦门日报记者 沈彦彦)1月20日,厦门市启动了2025年3C产品购新补贴发放,手机、平板、智能手表首次纳入政府补贴
2025-01-23 08:43:00
江苏:税惠暖新春 市场“年味足”
本文转自:人民网-江苏频道税务人员进入商超宣讲和服务。江苏税务供图临近春节,江苏各地大街小巷年味渐浓,节前消费市场火热
2025-01-23 08:45:00
字节跳动人气MOBA手游回国!《决胜巅峰》国服今日公测:支持华为鸿蒙原生系统
快科技1月23日消息,今日,字节跳动旗下沐瞳科技出品的人气MOBA手游《决胜巅峰》将在中国区开启公测,为其全球电竞版图添上最重要的一块拼图
2025-01-23 09:02:00