• 我的订阅
  • 头条热搜
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...请来了两位国产AI友情参赛(kimi和文心一言)。o1满血版实测体验并非「无敌」o1模型的强项在于数学等方面的高级推理,那么就先从擅长的地方开始,一道并不算困难的数学计算题:假设一个公司生产某种商品,生产成本与产...……更多
\
...大模型。MathGPT是否意味着“AI家教”成为可能?搜狐科技实测后发现MathGPT能够顺利完成小学试卷并且给出清晰的解答。在与GPT-4、文心一言的横向对比中,MathGPT在数学应用题能力上表现优于文心一言、不如GPT-4。作为垂直于教育...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、...……更多
文心一言“点评”李彦宏发布会紧张原因:对AI掌握不充分,担心被误解作秀
...计算能力、推理能力等方面为大家带来文心一言的深度真实测评!中文理解能力1.“今朝牙里相,老重光,老地方,吾请侬切饭哦”,这句话是哪个地方方言,什么意思?文心一言回答:总结:文心一言对于中文地方方言无法识...……更多
搜狐科技“实测”中外两款大模型:GPT-4写藏头诗失败,文心一言更懂中文?
...结果就已出现,更像是提前录制好的“DEMO”,而非现场实测。“不能说我们完全ready了,文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的,全球大厂还没有一个做出来的,百度是第一个。”发布会上,李彦宏坦言,自己测试...……更多
大模型“翻车”小学题?
...和13.8谁大?9家大模型,3家已翻车7月16日下午,南都记者实测阿里通义千问、百度文心一言、智谱清言、腾讯元宝、科大讯飞星火、字节跳动豆包、学而思九章大模型、面壁智能Luca、月之暗面Kimi等9家国产大模型。当南都记者输...……更多
搜狐科技实测腾讯混元大模型:能模仿鲁迅、林黛玉,还会玩梗换算“花西子币”
...在混元大模型发布后拿到内测资格,第一时间对其进行了实测。 能模仿鲁迅、林黛玉,生成代码显示错误据了解,腾讯混元大模型目前仅在微信小程序上线,在小程序搜索“腾讯混元助手”能够申请体验,也就是混元大模型的C...……更多
文心一言发布百度市值蒸发200亿,外界称缺乏亮点,应用前景难超ChatGPT
...发布仅仅是一小步,更大的挑战还在后面。具备多模态,实测后或将暴露更多问题在发布会现场,李彦宏通过提前录制的视频演示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成等五个方面的能力。从...……更多
实测升级后的文小言:吉卜力风周边一键生成,全新语音大模型、图片问答齐亮相
...尖模型能力,做出更强大、更简单的AI产品。” 搜狐科技实测显示,若切换至文心大模型并指定文心X1来解决问题,其优势在于灵活调用工具。以“设计吉卜力风的帆布包”为例,文心X1首先能精准解析吉卜力风格特点,再多次...……更多
推理性能直逼o1,DeepSeek再次出手,重点:即将开源
...波,不知道大家如何顶住。耐心等待的时间里,我们先来实测一下。一手实测体验与 OpenAI o1 相同的是,根据问题的复杂程度,它也需要「思考」数十秒后再回答。虽然有些过程中的思路在人类看来可能毫无意义,甚至是错误的...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...tman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文,支持20万长度的Kimi基本能理解指令要求,并就话题和观点、原文,在不到十多秒内就进行了输出。就此实测...……更多
“百模大战”,国产 GPT 大全
随着ChatGPT的爆火,国内科技公司不甘示弱,国产聊天机器人争相亮相。文| 刘佳玉目前,国内许多公司都在进行聊天机器人的相关研究。一些公司的聊天机器人面世之后,功能与用户体验甚至可以媲美ChatGPT。例如,Baidu的“文...……更多
百度首次现场演示大模型微调过程,「文心一言」调用成本下降90% | 最前线
文 | 周鑫雨编辑 | 苏建勋在大模型“扎堆”发布的当下,市场亟需更直观的方式,对模型能力做出判断。2023年3月16日,在百度文心一言的发布会上,模型采用的是录播Demo的演示形式。在36氪的专访中,百度CEO李彦宏给出了理由...……更多
百度文心一言发布会详细纪要
...过去的十几年当中,一直在AI的研发上坚持投入。文心大模型第一个版本2019年就发布了,此后每年都要发布一个新版本。所以从这个意义上说,文心一言的发布只是我们过去多年努力的自然延续。但毕竟今天的文心一言,是要对...……更多
百度发布两款大模型,对标DeepSeek、聚焦多模态
...日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半...……更多
国产大模型首发中文逻辑推理,「天工大模型4.0」o1版来了
...然,Skywork o1 的成色如何,我们还是得看实战效果。一手实测这次 Skywork o1 彻底拿捏住了推理机器之心提前拿到了测试资格,对 Skywork o1 系列模型,尤其是 Lite 和 Preview 版本的推理能力进行了全方位的考察。下图为 Skywork o1 Lite ...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...。在多模态理解图文问答任务上,开闭源模型平分秋色,国产模型表现突出。国产多模态模型在中文语境下的文生图能力与国际一流水平差距较小。多模态模型的文生视频能力上,对比各家公布的演示视频长度和质量,Sora有明...……更多
跟文心一言讨论庄周梦蝶,它让我拥抱美好世界
...作能力,更能凸显文心一言的语言处理能力。文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,以及百亿级语音日均调用数据,在5500亿事实的知识图谱的训练下,文心一言能够实现“读万卷书”的...……更多
全球都在搞AI,为什么是百度挣到钱?
...际产生价值”将成为所有人无法回避的难题。对此,作为国产大模型代表的百度,正在给出自己的答案。2月28日,百度2023年第四季度及全年财报正式发布。不仅业绩数据亮眼,在同日举行的业绩报告会上,百度创始人、董事长...……更多
...公司于财报前发布报告称,百度基本盘核心广告复苏,大模型或将加大投入,维持跑赢行业的评级。回顾2022年业绩表现,期内百度实现总营收1236.75亿元,Non-GAAP净利润206.8亿元。今年,大模型浪潮席卷而来,百度成为最先邀请内...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
连发两款模型“补课”,百度AI成色如何?
...杨锦没有发布会、没有李彦宏,百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1,免费。两年前的3月,百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品,也让外界看到百度相对迅速的先手布局...……更多
IDC权威评测:文心快码位居国内代码生成产品评估第一
...计截至2025年2月专业开发场景下,文心快码 C++ 产品能力实测总分第一在代码生成实测维度,当企业调用大模型能力来辅助编码时,可能在对话问答、搜索、代码生成工具等多个网页、客户端、APP的应用服务中展开,IDC 围绕专门...……更多
...16、Mac系统和ios18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。受此影响,昨日百度港股直线拉升,午盘大涨6.42%,截至收盘涨幅回落至2.8%。而A股市场的大模型概念股则全...……更多
文心大模型技术交流会在四川成都举行
本文转自:人民网-四川频道文心大模型技术交流会。记者 宋豪新摄人民网成都6月7日电 (记者宋豪新)6月6日,在文心大模型技术交流会(成都)上,百度智能云推出“Comate”代码助手,并正式开放邀测。据介绍,“Comate”代...……更多
...搜”所说那样完全不及格,讯飞星火、阿里巴巴Qwen2-72b等国产大模型在高考数学客观题中具有较高的准确率,令人眼前一亮。当然,LLMEVAL团队在评测后也指出,大模型在数学推理任务中的鲁棒性与准确性仍有很大的提升空间。...……更多
百度与优必选合作,人形机器人“大脑”有了AI大模型
...实现难度,在全球范围内属于行业第一梯队水平。百度是国产大模型领导者,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力。在近日弗若斯特沙利文发布的《2024年中国大模型能力评测》...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...讯飞就与华为共同发布星火一体机,让所有企业都可以在国产自主创新平台上私有化部署大模型。一来,星火一体机基于星火认知大模型,针对污语料和幻觉问题,形成了“立体化”的内容安全机制。二来,星火一体机基于昇腾...……更多
“整活”保险业务,AI大模型哪家强?
一款款AI大模型横空出世,各行各业都在尝试下棋落子,保险业也不例外。号称神通广大的AI大模型能否完美“适配”保险行业?10月10日发布的《人工智能大模型保险行业应用评测报告》(以下简称《报告》)便揭晓了答案。根...……更多
李彦宏:百度AI构架有优势,性能较低的国产芯片仍可高效运作!
...司能有效地进行模型训练和推理,即使是使用性能较低的国产芯片仍能维持高效率。资料显示,虽然百度之前主要依赖于英伟达的AI芯片,但是百度也有自己的自研的XPU架构的AI芯片——昆仑芯,2021年7nm的昆仑2代芯片就已经量产...……更多
更多关于科技的资讯:
温特纳科技:为压力扫描阀和气动探针提供一站式校准服务
从航空航天到汽车动力,从风洞实验到无人机飞行测试,精确的流场测量和压力数据采集是确保产品设计和研发进度的重要保障。很多科研工作者在采购压力扫描阀和气动探针后
2025-08-08 15:27:00
智能饮品革命:东方慧影如何用“零成本”方案破解餐饮行业人工困局
一、餐饮行业的成本之痛,政策改变迫使餐饮商家做出调整截至2025年,餐饮行业人工成本高达32.7%,较疫情前上升了8%
2025-08-08 15:27:00
官方数据首度公开!TikTok Shop跨境日本、欧洲五国新市场大促双爆发
近日,TikTok Shop新市场捷报频传!日本站点开放仅一个月,首场大促便斩获“开门红”;与此同时,欧洲五国德法意西
2025-08-08 15:27:00
当连锁药房遇上“好老板”,通联支付助力“为了你”健康药房升级收银服务
药店买药免排队、秒支付!近日,通联支付与当地邮政联合,为云南“为了你健康药房”上线“好老板”轻应用,助力连锁药店升级一站式智慧收银平台
2025-08-08 15:27:00
追求健康美食的你,是否渴望一种便捷烹饪方式?空气炸锅正是你的理想选择!它利用高速循环热风,无需大量油脂就能烹饪出酥脆可口的食物
2025-08-08 15:27:00
格力高上海工厂探访:本土化研发与智能智造驱动市场领跑
近日,格力高首次向媒体开放其位于上海的智能化生产基地,揭秘这家百年食品企业如何通过“本土化研发+智能智造”双轮驱动,实现从消费者需求洞察到产品快速落地的高效转化
2025-08-08 15:27:00
效率跃升18倍!曙光超智融合引领生命科学新范式
当前,海量生物数据的处理与分析能力已成为制约行业发展的关键瓶颈。近日,依托曙光超智融合技术建设的华东某全国产计算中心,与单细胞测序领域代表性企业墨卓生物达成战略合作
2025-08-08 15:27:00
传奇再启:赛德斯签约品牌强国新品即将来袭
2025年8月5日,中国知名电竞音频品牌赛德斯(SADES)在广东深圳正式签约“品牌强国·自主品牌优选工程”,成功入选该国家级项目成员单位
2025-08-08 15:27:00
餐饮行业在服务消费中地位举足轻重。当下的中国餐饮行业正在经历从“速度增长”到“效率竞争”的结构性转变。根据中国烹饪协会发布的《2024年全国餐饮业发展回顾与2025年展望》(以下简称“报告”)数据显示
2025-08-08 15:27:00
名众集团首创的基因枪无创草本抗衰技术,历经7年研发60万例临床,再次突破
名众集团自2018年自主研发首创了“四维形气美学”“草本0创还原术”后,历经7年研发60万例临床,再次实现重大技术突破
2025-08-08 15:27:00
视源股份投屏黑科技:3秒丝滑连接,比掏手机还快!
会议室的桌面上总缠着一堆线缆 ——VGA 线、DP 线、HDMI 线像乱麻一样,某企业高管曾因笔记本找不到匹配接口,让二十多位参会者等了十来分钟
2025-08-08 15:32:00
G视觉|全球首创!贵州嘉尚百米智能隧道窑日产40吨正极材料
走进贵州嘉尚新能源材料有限公司全球首创的100米全自动化隧道窑生产车间,自动化设备高效运转,机械臂精准作业,智能系统实时监控着从投料到产出的全过程
2025-08-08 15:42:00
千万粉丝主播“秀才”复活?抖音:仍在封禁状态,不存在“借壳复活”
8月7日上午,“网红秀才疑似借壳复出”的词条,冲上微博热搜榜单。据媒体8月6日报道,2023年被封禁的千万粉丝网红秀才疑似“借壳复出”
2025-08-08 15:46:00
中国人寿联合知乎、每日人物开展“各年龄圈消费大摸底”
近日,中国人寿保险股份有限公司(以下简称“中国人寿”,股票代码:601628.SH,2628.HK)携手知乎“数洞”实验室
2025-08-08 16:06:00
德才高科中东合作签约 全球化战略迈出坚实一步
大众网记者 薛岳 通讯员 杨佳蓓 青岛报道8月4日,中东地区代表团ALNABULSI, ABDULAZIZ ALIY与IYAD MOH'D JAMIL HUSNI QAWASME
2025-08-08 16:44:00