• 我的订阅
  • 头条热搜
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...请来了两位国产AI友情参赛(kimi和文心一言)。o1满血版实测体验并非「无敌」o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:假设一个公司生产某种商品,生产成本与产...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相
...尖模型能力,做出更强大、更简单的AI产品。” 搜狐科技实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首先能精准解析吉卜力风格特点,再多次...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...波,不知道大家如何顶住。耐心等待的时间里,我们先来实测一下。一手实测体验与 OpenAI o1 相同的是,根据问题的复杂程度,它也需要「思考」数十秒后再回答。虽然有些过程中的思路在人类看来可能毫无意义,甚至是错误的...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文,支持20万长度的Kimi基本能理解指令要求,并就话题和观点、原文,在不到十多秒内就进行了输出。就此实测...……更多
百度发布两款大模型,对标DeepSeek、聚焦多模态
...日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...然,Skywork o1 的成色如何,我们还是得看实战效果。一手实测这次 Skywork o1 彻底拿捏住了推理机器之心提前拿到了测试资格,对 Skywork o1 系列模型,尤其是 Lite 和 Preview 版本的推理能力进行了全方位的考察。下图为 Skywork o1 Lite ...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...。在多模态理解图文问答任务上,开闭源模型平分秋色,国产模型表现突出。国产多模态模型在中文语境下的文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明...……更多
全球都在搞AI,为什么是百度挣到钱?
...际产生价值”将成为所有人无法回避的难题。对此,作为国产大模型代表的百度,正在给出自己的答案。2月28日,百度2023年第四季度及全年财报正式发布。不仅业绩数据亮眼,在同日举行的业绩报告会上,百度创始人、董事长...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
连发两款模型“补课”,百度AI成色如何?
...杨锦没有发布会、没有李彦宏,百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1,免费。两年前的3月,百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品,也让外界看到百度相对迅速的先手布局...……更多
IDC权威评测:文心快码位居国内代码生成产品评估第一
...计截至2025年2月专业开发场景下,文心快码 C++ 产品能力实测总分第一在代码生成实测维度,当企业调用大模型能力来辅助编码时,可能在对话问答、搜索、代码生成工具等多个网页、客户端、APP的应用服务中展开,IDC 围绕专门...……更多
...16、Mac系统和ios18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。受此影响,昨日百度港股直线拉升,午盘大涨6.42%,截至收盘涨幅回落至2.8%。而A股市场的大模型概念股则全...……更多
...搜”所说那样完全不及格,讯飞星火、阿里巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...实现难度,在全球范围内属于行业第一梯队水平。百度是国产大模型领导者,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力。在近日弗若斯特沙利文发布的《2024年中国大模型能力评测》...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...讯飞就与华为共同发布星火一体机,让所有企业都可以在国产自主创新平台上私有化部署大模型。一来,星火一体机基于星火认知大模型,针对污语料和幻觉问题,形成了“立体化”的内容安全机制。二来,星火一体机基于昇腾...……更多
“整活”保险业务,AI大模型哪家强?
一款款AI大模型横空出世,各行各业都在尝试下棋落子,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根...……更多
李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...司能有效地进行模型训练和推理,即使是使用性能较低的国产芯片仍能维持高效率。资料显示,虽然百度之前主要依赖于英伟达的AI芯片,但是百度也有自己的自研的XPU架构的AI芯片——昆仑芯,2021年7nm的昆仑2代芯片就已经量产...……更多
倒计时10天!百度世界2023五大亮点全剧透
...月发布以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生...……更多
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...21日消息,在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。其中,文心X1 Turbo在逻...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
近日,OpenAI宣布,为了维护服务质量和安全性,7月9日起将采取额外措施来限制来自当前不支持的国家和地区的API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...彦宏在Create2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...主要角色介绍、情节分析、影响等角度列出概述大纲。在实测过程中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对财报中的财务数据进行解读,并按照财报叙述逻辑总结重点。除此之外,万知还可以...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
终于,国产大模型能在综合能力上也能与GPT-4o一决雌雄了。在12项指标的测试中,这个模型有11项都超过了GPT-4o,综合能力则高出了10个百分点。而且在诗词赏析等中文特色领域优势更加明显,“最难中文Benchmark”弱智吧也有重...……更多
文心大模型赋能千行百业,自主进化
...出世,各行各业的生产力似乎都将被AI大模型再次点燃。国产大模型的数量快速增长,截至10月,国内已发布238个大模型。尽管围绕AI大模型技术变革之力的讨论层出不穷,但行至今日,AI大模型技术的发展重点已然在于“如何赋...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
生成式AI慢人一步的苹果,选择与百度合作,是正确的选择吗?
...不是苹果第一次“落后”,比如充电功率过低、拍照不如国产旗舰机,标准版高刷的缺失等等,这几年在很卷的国产手机面前,苹果好像就剩下了一个“生态”的优势。苹果的落后不止一次,但这次不同。2023年以ChatGPT为代表的A...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
百度发布文心大模型4.5、文心大模型X1。3月16日,百度(Nasdaq:BIDU,09888.HK)正式发布文心大模型4.5及文心大模型X1。目前,两款模型均已在文心一言官网上线,用户登录即可免费体验。同时,企业及开发者可在百度智能云千帆...……更多
实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种
...句“我不喝豆汁儿”,他就真给你做北京一日游攻略啊。实测「汽车版DeepSeek」更新理想OTA 7.2版本后,进入语音设置界面会看到一个深度思考的按钮,就像咱们日常用的DeepSeek一样,点击打开:你也可以用语音对话,让理想同学...……更多
更多关于科技的资讯:
河北新闻网讯(王闯)一体化电机一台、组合开关一台……11月24日,开滦集团唐山矿业公司(简称“开滦山矿公司”)综采一区主管机电工作的副区长李振辉轻点鼠标
2025-12-01 18:13:00
鲁网12月1日讯泰安联通聚焦精品网络建设核心,持续深化云网融合能力、优化网络运维体系、升级服务保障机制,为区域数字经济发展筑牢通信底座
2025-12-01 13:35:00
冬日有暖意 服务联万家——泰安联通客户日打造贴心服务体验
鲁网12月1日讯初冬时节,寒意渐起,但服务的温度却未曾缺席。近日,泰安联通在全市各营业厅成功举办“联通客户日暖冬回馈季”主题活动
2025-12-01 13:37:00
王倩:以“法律+”思维,护航企业破局新生
巾帼不让须眉:年轻有为的破产破局者,王倩用专业赢得信任当企业陷入债务泥潭,当债权人与债务人的利益激烈碰撞,当投资人寻求危局中的机遇——破产业务从来不是简单的“清算注销”
2025-12-01 09:25:00
重塑健康增长范式,米连科技或将引领互联网发展新路径
在互联网行业经历深刻变革的今天,追求健康、可持续的增长模式已成为企业生存发展的关键。米连科技通过其独特的战略路径,向业界展示了一条超越“烧钱换规模”传统逻辑的新型发展道路
2025-12-01 09:55:00
《和平精英》地铁逃生「冰雪危途」全新赛季火热开启,这把雪赚到底!
列车一响,雪赚开场!《和平精英》地铁逃生全新赛季「冰雪危途」,11月29日,邀你雪赚启航!用创新玩法,拓宽地铁逃生摸金搜打撤的边界
2025-12-01 09:55:00
邮储银行唐山市分行以“政策落地+精准赋能”为主线,积极构建专业化科技金融服务体系,全力支持新质生产力发展。该行创新推出“网点深耕+全链服务”模式
2025-12-01 10:02:00
近日,人保财险唐山燕新路营销服务部组建专项服务小组,走进公司周边场所,开展“面对面、零距离”客户服务行动。活动现场,工作人员以客户需求为导向
2025-12-01 10:06:00
信息技术的迅速发展,尤其是大数据的广泛应用,正在推动医保体系发生深刻变革。传统的医保支付方式已经难以适应现代医疗服务的复杂性与多样化需求
2025-12-01 07:04:00
“一上午加了8位境外采购商”
本报讯(全媒体记者陈春伟、实习生罗家骏)“嘀”的一声,江西华昌竹业集团有限公司外贸经理严慧的微信好友列表里,又多了一位国际采购商
2025-12-01 07:05:00
11月16日,一艘装载邢台纳科诺尔精轧科技股份有限公司生产的辊压分切一体机的货轮,从天津港环球滚装码头启航驶往海外。至此
2025-11-30 07:36:00
坚定信心 勇挑大梁·产业新亮点丨“能址星图”如何全省率先把数据“变现”?
10月18日,在2025中国国际数字经济博览会上,秦皇岛市大数据有限公司展示“能址星图”数据产品。 石 勇摄“我们的‘能址星图’产品上架两三个月时间
2025-11-30 07:37:00
重磅!鸣望教育签约英国子午线英语,解锁中英教育合作新范式!
2025年11月20日,鸣望教育行业赋能第27届研讨峰会,达成一项重磅签约。鸣望教育与拥有46 年专业积淀的英国子午线英语学校(Meridian English)正式达成战略合作
2025-11-30 12:05:00
新生态、新平台、新增长|鲸鸿动能数智赋能品牌确定性增长
2025年,中国消费市场的竞争正从流量红利的浅层博弈,迈向以生态力为引擎、深度运营为核心的新阶段。在这一关键转折点,鲸鸿动能于11月28日成功举办“鸿蒙商业增长论坛·品牌营销沙龙”
2025-11-30 12:05:00
全运会宣传中惊现AI MV:谁在用算法谱写湾区之声?
第十五届全国运动会于11月21日圆满落下帷幕。记者从组委会了解到,一首全程由AI生成的原创宣传MV《向着光的方向》已被正式收录进本届赛事的官方宣传素材库
2025-11-30 12:06:00