• 我的订阅
  • 头条热搜
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...请来了两位国产AI友情参赛(kimi和文心一言)。o1满血版实测体验并非「无敌」o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:假设一个公司生产某种商品,生产成本与产...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...计算能力、推理能力等方面为大家带来文心一言的深度真实测评!中文理解能力1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?文心一言回答:总结:文心一言对于中文地方方言无法识...……更多
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
...结果就已出现,更像是提前录制好的“DEMO”,而非现场实测。“不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。”发布会上,李彦宏坦言,自己测试...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...发布仅仅是一小步,更大的挑战还在后面。具备多模态,实测后或将暴露更多问题在发布会现场,李彦宏通过提前录制的视频演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个方面的能力。从...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...波,不知道大家如何顶住。耐心等待的时间里,我们先来实测一下。一手实测体验与 OpenAI o1 相同的是,根据问题的复杂程度,它也需要「思考」数十秒后再回答。虽然有些过程中的思路在人类看来可能毫无意义,甚至是错误的...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文,支持20万长度的Kimi基本能理解指令要求,并就话题和观点、原文,在不到十多秒内就进行了输出。就此实测...……更多
“百模大战”,国产 GPT 大全
随着ChatGPT的爆火,国内科技公司不甘示弱,国产聊天机器人争相亮相。文| 刘佳玉目前,国内许多公司都在进行聊天机器人的相关研究。一些公司的聊天机器人面世之后,功能与用户体验甚至可以媲美ChatGPT。例如,Baidu的“文...……更多
百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线
文 | 周鑫雨编辑 | 苏建勋在大模型“扎堆”发布的当下,市场亟需更直观的方式,对模型能力做出判断。2023年3月16日,在百度文心一言的发布会上,模型采用的是录播Demo的演示形式。在36氪的专访中,百度CEO李彦宏给出了理由...……更多
百度文心一言发布会详细纪要
...过去的十几年当中,一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了,此后每年都要发布一个新版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的自然延续。但毕竟今天的文心一言,是要对...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...然,Skywork o1 的成色如何,我们还是得看实战效果。一手实测这次 Skywork o1 彻底拿捏住了推理机器之心提前拿到了测试资格,对 Skywork o1 系列模型,尤其是 Lite 和 Preview 版本的推理能力进行了全方位的考察。下图为 Skywork o1 Lite ...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...。在多模态理解图文问答任务上,开闭源模型平分秋色,国产模型表现突出。国产多模态模型在中文语境下的文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...作能力,更能凸显文心一言的语言处理能力。文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,以及百亿级语音日均调用数据,在5500亿事实的知识图谱的训练下,文心一言能够实现“读万卷书”的...……更多
全球都在搞AI,为什么是百度挣到钱?
...际产生价值”将成为所有人无法回避的难题。对此,作为国产大模型代表的百度,正在给出自己的答案。2月28日,百度2023年第四季度及全年财报正式发布。不仅业绩数据亮眼,在同日举行的业绩报告会上,百度创始人、董事长...……更多
...公司于财报前发布报告称,百度基本盘核心广告复苏,大模型或将加大投入,维持跑赢行业的评级。回顾2022年业绩表现,期内百度实现总营收1236.75亿元,Non-GAAP净利润206.8亿元。今年,大模型浪潮席卷而来,百度成为最先邀请内...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
...16、Mac系统和ios18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。受此影响,昨日百度港股直线拉升,午盘大涨6.42%,截至收盘涨幅回落至2.8%。而A股市场的大模型概念股则全...……更多
...搜”所说那样完全不及格,讯飞星火、阿里巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...实现难度,在全球范围内属于行业第一梯队水平。百度是国产大模型领导者,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力。在近日弗若斯特沙利文发布的《2024年中国大模型能力评测》...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...讯飞就与华为共同发布星火一体机,让所有企业都可以在国产自主创新平台上私有化部署大模型。一来,星火一体机基于星火认知大模型,针对污语料和幻觉问题,形成了“立体化”的内容安全机制。二来,星火一体机基于昇腾...……更多
“整活”保险业务,AI大模型哪家强?
一款款AI大模型横空出世,各行各业都在尝试下棋落子,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根...……更多
李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...司能有效地进行模型训练和推理,即使是使用性能较低的国产芯片仍能维持高效率。资料显示,虽然百度之前主要依赖于英伟达的AI芯片,但是百度也有自己的自研的XPU架构的AI芯片——昆仑芯,2021年7nm的昆仑2代芯片就已经量产...……更多
倒计时10天!百度世界2023五大亮点全剧透
...月发布以来,文心一言在一个月内即完成四次升级,让大模型的推理成本降低至原来的十分之一;文心大模型升级至3.5版本后,训练速度提升到原来的3倍,推理速度达到原本的30多倍。它是否还能更进一步,追超GPT-4,在生活生...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
近日,OpenAI宣布,为了维护服务质量和安全性,7月9日起将采取额外措施来限制来自当前不支持的国家和地区的API流量,其中就包括中国。这意味着国内大量“套壳”大模型将无法使用,而自研大模型凸显价值。这无疑给国内的...……更多
李彦宏发布文心大模型4.0工具版,推理成本降到1%
...彦宏在Create2024百度AI开发者大会上,正式宣布发布文心大模型4.0的工具版。李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1...……更多
体验报告来了!记者亲测百度“文心一言”
...顺地问答完整。随后,我们又问了关于国内涉足预训练大模型的公司有哪些?文心一言回答得也较为全面。记者尝试了一个需要涉及信息搜索的问题。特斯拉在国内过去五个月、过去一年的销量是多少?文心一言的答案是:而记...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...主要角色介绍、情节分析、影响等角度列出概述大纲。在实测过程中,一篇169页的全英文财报,万知小程序可在3秒内对内容重点进行提炼,对财报中的财务数据进行解读,并按照财报叙述逻辑总结重点。除此之外,万知还可以...……更多
11项指标击败GPT-4o!360攒局让16家大模型联手作战
终于,国产大模型能在综合能力上也能与GPT-4o一决雌雄了。在12项指标的测试中,这个模型有11项都超过了GPT-4o,综合能力则高出了10个百分点。而且在诗词赏析等中文特色领域优势更加明显,“最难中文Benchmark”弱智吧也有重...……更多
文心大模型赋能千行百业,自主进化
...出世,各行各业的生产力似乎都将被AI大模型再次点燃。国产大模型的数量快速增长,截至10月,国内已发布238个大模型。尽管围绕AI大模型技术变革之力的讨论层出不穷,但行至今日,AI大模型技术的发展重点已然在于“如何赋...……更多
更多关于科技的资讯:
泰康在线:持续加码科技理赔
随着互联网保险的快速普及和大数据、人工智能等技术的快速发展,车险理赔服务驶入了数字化、智能化转型的快车道。作为一家互联网财险公司
2025-02-19 09:31:00
本文转自:人民网人民网北京2月19日电 据北京协和医院公众号消息,2月16日,北京协和医院与中国科学院自动化研究所共同研发的“协和·太初”罕见病大模型正式进入临床应用阶段
2025-02-19 09:34:00
鸣鸣很忙2024年零售555亿元,推自有品牌和新门店模式
文|李振兴2月17日,鸣鸣很忙召开“2025鸣鸣很忙省钱战略发布会”。鸣鸣很忙称2024年零售额突破555亿元,在营门店数已经超过15000家
2025-02-19 09:41:00
为做好客户服务、提升客户体验,山东移动聊城分公司近期开展了以“冬日关爱暖人心宽带义诊进万家”为主题的客户体验活动。此次活动
2025-02-19 09:48:00
比陆运省时70%:我国一大型无人机城际低空物流航线成功首航
快科技2也19日消息,据央视新闻报道,近日,一架满载新鲜羊肉的大型固定翼无人机从陕西榆林的榆阳马合通用机场起飞。经过2小时47分钟的飞行后
2025-02-19 09:56:00
1月中国汽车市场成交均价30万以上品牌销量一览:腾势增速第一
快科技2月19日消息,近日有博主汇总了2025年1月中国市场成交均价30万以上的品牌销量TOP10,其中腾势增速第一。从榜单中可以看到
2025-02-19 09:56:00
大反转!一个月后 RTX 5090供应量将高得离谱
快科技2月19日消息,过去一段时间,RTX 5090缺货缺得离谱,甚至加钱都不一定能买到。但接下来,情况要改观了。综合多方报道
2025-02-19 09:56:00
游戏神器!REDMI电竞小尺寸平板Q3发布:满血天玑9400
快科技2月19日消息,目前,安卓阵营的平板电脑尺寸越来越大,10英寸及以上成为主流,当前市场上只有联想拯救者还在坚持推出小尺寸旗舰平板
2025-02-19 09:56:00
波音因NASA合同未续签拟裁员200人:太空探索前景堪忧
快科技2月19日消息,据报道,波音公司近日向约200名参与太空发射系统(SLS)项目的员工发出裁员通知,原因是其与美国国家航空航天局(NASA)的合同将于3月到期
2025-02-19 09:56:00
年轻人住宿新偏好 酒店情绪价值如何打造?
当下酒店行业正经历着一场变革,各种新玩法层出不穷, “始于酒店,但不止于酒店” 的理念日益凸显。酒店不再仅仅是提供住宿和餐饮的场所
2025-02-19 10:04:00
长剧经验赋能短剧商业生态欢娱影视《吉天照》探索短剧合作新模式
欢娱影视旗下短剧厂牌娱丸影视打造的首部竖屏精品短剧《吉天照》凭借多反转的叙事与精品化制作获得观众好评。主角小梅步步为营
2025-02-19 10:04:00
针对小微企业多样化需求,张家口农商银行宣泰支行探索创新更多高效便捷的金融产品和服务模式,持续打通金融服务小微企业“最后一公里”
2025-02-19 10:07:00
《工程管理前沿》(英文刊)聚焦下一代智慧交通系统
本文转自:人民网-湖北频道中国工程院院刊《工程管理前沿》(英文刊)2024年第11卷第4期城市化进程加速和人口增长,传统交通系统面临着前所未有的挑战
2025-02-19 10:10:00
北京学央美设计最好的画室是哪家?
北京哪家画室央美设计最厉害?根据2025年最新行业数据及成绩、口碑调研,北京新高度画室在央美设计方向的综合实力最为突出
2025-02-19 10:17:00
新茶饮:虽古茗破发、喜茶“刹车”,但我尚好
相较追求门店数量增长,更重视由产品差异化和创新性、单店营收和运营效率提升带来的业务增量。文/每日财报林岚对于新茶饮品牌而言
2025-02-19 10:22:00