• 我的订阅
  • 头条热搜
谷歌推出搜索增强事实评估器
3月31日消息,无论当下AI聊天机器人有多么强大,都会或多或少存在一大饱受诟病的行为——以看上去令人信服的方式,向用户提供与事实不符的回答。简单来说,AI有时会在回答中“满口跑火车”,甚至“造谣”。图源Pixabay防...……更多
脚步不会停止,步步关乎高教
...。在刚刚过去的2023年,人工智能取得了长足进步,聊天机器人、语言模型等在各行业的应用都取得了突破性进展,并已经改变了医疗保健、金融和教育等行业。今天Sora的出现,是过去一年人工智能发展所达到的又一个高峰。我...……更多
OpenAI入局AI搜索 SearchGPT演示中“翻车”
...行。根据知名半导体机构Semianalysis的一份报告,光AI聊天机器人ChatGPT每天的运行成本就有约69万美元,而这仅仅是计算机硬件的成本。如果考虑到运营成本、研发和人员配备费用,这个数字还会更高。近期,有外媒援引一份OpenAI...……更多
Ai Pin两位高管再创业!瞄准企业AI搜索,估值2500万美元
...回答的时候拒绝回答,而不是进行编造。这是许多AI聊天机器人都在努力解决的问题。结语:解决AI搜索痛点,Infactory的未来发展当前,谷歌、微软、OpenAI和其他公司正在主导一场生成式AI军备竞赛,几乎每个行业的公司都在争先...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...地响应用户的需求,单一样本的回答质量是衡量一个聊天机器人的关键指标,但这一指标并不足以全面评估模型在允许更充裕推理时间时的综合性能。 针对以上问题,研究人员对如何在大语言模型推理过程中提高回答的多样性...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...智能发展中的一个重大挑战是确保语言模型生成的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...赖直觉而非深入的搜索和解决问题的能力。此外,模型与机器人对弈时的分数比与人类对弈时的分数要低。田渊栋认为这可能是因为人类在有限的时间内可能没有机器人那么擅长发现战术上的失误。所以,这种比赛可能并不足以...……更多
...担忧。早在AI研究公司OpenAI于2011年11月份首次推出AI聊天机器人ChatGPT三个月前,Facebook母公司Meta就曾发布过类似的聊天机器人。但Meta首席人工智能科学家雅恩・勒昆(YannLeCun)表示,与ChatGPT立即爆火、上线五天里就有100多万用...……更多
AI“爆改”搜索引擎,搜索行业之变
...内测;而小红书也在去年推出AI群聊后,又测试了AI聊天机器人“DAVINIC”;去年12月,抖音则在主APP内测试“AI搜”的智能搜索功能。在抖音搜索界面,“AI搜”处于较高权重位置,仅次于综合、用户、视频、商品服务。小红书推...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...用户。在分析过程中,模型准确地识别出了视频中的四足机器人,并对其外观、所处的环境以及所进行的活动进行了详细的描述。GPT-4o视频测试回复 相比之下,Gemini 1.5 Pro的回复则显得简略又单调,在记者第二次追问下,才充...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问...……更多
新闻传播业的生成式人工智能应用及其风险应对
...能的内容生成和交互水平取得突破性进展。人工智能聊天机器人程序ChatGPT、人工智能图片生成平台Midjourney和文生视频大模型Sora等生成式人工智能出现,掀起内容生产和信息消费热潮。生成式人工智能的数据训练、程序设计和生...……更多
OpenAI「补票」AI 搜索,SearchGPT 没有野心
...器幻觉问题一直存在,Perplexity 也不例外。6 月,其聊天机器人就被爆出在缺乏直接访问原文的情况下产生机器幻觉,通过 URL 和搜索引擎碎片信息重建内容,生成看似准确的摘要,实则可能包含不准确甚至完全虚构的信息。这也...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
作者|桑明强“一个小小的客服机器人能有多高的社会价值?”如果把这个问题放在几年前,很多人脑海里的第一反应仍停留在电商时代中那接近傻瓜式的智能客服,这些机器人通常被设定了几个高频关键词,但一旦遇到稍难...……更多
AI教育应用潮涌 豆神端模一体新物种成功突围
...出了“端模一体”概念, ‌端模一体‌是指将大模型和机器人的端(终端设备)结合起来,形成一个整体的系统。通过端模一体化的设计,机器人的智能水平、规划能力都得到了大幅度的提升,可以根据具体场景选择合适的大...……更多
IDC首次发布移动端大模型应用市场竞争力分析研究报告
...竞争力分析研究报告,评估了市场上 8 款热门 Chatbot 聊天机器人模型,并分析、洞察了相关 AI 模型的性能和特征。 IT之家附上本次评估的 8 款 Chatbot App 如下(按照公司拼音首字母顺序排列):kimi 智能助手 豆包 海螺 AI 天工 ...……更多
打造全球智能消费决策社区,「阿尔特科技」希望提供“像闺蜜一样”有针对性的消费决策辅助 | 早期项目
...,以便收集消费决策转化率、用户对推荐的满意度、聊天机器人反馈等数据。该团队计划根据公测结果进一步优化模型和App设计,逐步迭代版本,或将在12月24日全面上线。团队协作开发、优化软件 | 图片来源:阿尔特科技「阿...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...方案,结合了自动指标和人工评估,以衡量引文准确性、事实正确性、内容覆盖率、连贯性和整体质量,确保评估的稳健和可重复性。 SchlarQA-CS的数据样例和评估概述评估结果评估中使用了开放权重模型Llama 3.1(8B、70B)以及专...……更多
微软的AI赌局,谷歌为何没敢接
...用维基百科:“ChatGPT是由OpenAl开发的一个人工智能聊天机器人程序,于2022年11月推出……”百度则会筛选搜索内容,并摘取答案直接回答在第一条的显著位置:“聊天机器人,chatgpt是OpenAl开发的一个大型预训练语言模型……”...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...top K 值等),可以通过调整它来提升模型的性能。但是,事实证明人工提示词工程费时费力,还需要用户对提示词的结构和模型行为都有很好的理解。对于某些任务而言,我们也很难准确而简洁地传达指令。另外,人类也没有能...……更多
中国AI专利最多的5个公司!华为第5,平安第3,腾讯第1
...控制、配电用网、智能配电电压器、系统能源、智能巡检机器人等多方面。国家电网的专利战略集中在机器学习 以及人工智能应用场景等相关技术分支,展现了其在智能电网和能源管理领域的技术实力和创新能力。AI技术在电网...……更多
超级干货丨360AI搜索如何准确识别用户意图?
...,让模糊问题和复杂问题迎刃而解。 过去的搜索、聊天机器人产品对用户的要求很高,你如果不会提出问题,就得不到答案,现在AI搜索有了慢思考能力,大模型会像一个很聪明的人一样,深度思考你说过的话,通过自主反思、...……更多
他承认了!“或对特朗普案,有重要影响”!
...中的任何一个。最终,科恩承认,他使用了谷歌的AI聊天机器人Bard生成相关案件引文。Bard是谷歌在2023年3月推出的一款AI聊天机器人,其背后的大模型拥有1370亿参数,推出之时就被认为是谷歌面对OpenAI(及其背后的微软)推出的...……更多
微软又给谷歌「双重暴击」或将加入word、ppt和excel
...露,微软计划利用OpenAl的技术,在Word和Outlook中创建聊天机器人风格的程序,这些程序类似于OpenAl的「顶流」ChatGPT,可以根据提示编写整套文本。相较于微软和谷歌目前提供的服务,聊天机器人带来的新功能,将会产生很重大的...……更多
我用AI机器人,20分钟写了份调研报告
...用AI工具,搭建了一个名字叫“欧阳羞”的商业模式分析机器人,来撰写一份关于特定项目的商业模式分析报告。主要包含以下几个关键步骤:确定分析方法信息检索制定文章大纲搭建调研报告机器人PPT生成(番外篇)假设,这...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...多复杂决策任务中取得了显著的成功。我们在自动驾驶、机器人控制和推荐系统等实际应用中,越来越依赖于这些智能系统。然而,现实世界中的强化学习在应用过程中也面临着巨大的挑战,尤其是如何保证系统的安全性。为了...……更多
柴继军:AIGC趋势不容逆转,积极推动视觉大模型项目落地
...众人物的虚假陈述;生成虚假图像,传播错误事实;水军机器人信息等。版权保护同样是一大挑战。柴继军认为,目前来说,大家形成的共识是作品只能源自于人,而人工智能的内容目前还不能被认定为著作权保护的作品来进行...……更多
谷歌发布ai前沿成果,生成式ai迎来爆发
...动创作音乐,还有DanceDiffusion,此外,当前最热门的聊天机器人ChatGPT的研发者OpenAI也推出过Jukebox。但值得注意的是,这些可自动生成音乐的AI系统,受限于技术和数据等因素,创作的音乐都比较简单,相对而言并不复杂。和前辈...……更多
谷歌最新自然语言推理算法
...辑推理方法:1、前向链式推理(ForwardChaining,FC),即从事实和规则出发,在做出新的推理并将其加入理论之间进行迭代,直到目标陈述可以被证明或推翻;2、后向链式推理(BackwardChaining,BC),即从目标出发,将其递归分解为子...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...大量的 AI 生成问题,大量的 AI 回答问题。社区里充满了机器人和数字人的提问者和答主,大量甚至大多数问题和答案都是 AI 生成的。在硅星人与知乎创始人、CEO 周源最近的一次对话中,周源对 "NPC 答主 " 的态度高度审慎:" 平...……更多
更多关于科技的资讯:
双城耀国庆 绮梦筑新章——恐龙园集团文旅产品“出圈”更“出彩”
今年国庆、中秋假期恐龙园集团旗下环球恐龙城与东方盐湖城凭借全新业态与沉浸式体验双双跻身长三角文旅“顶流”双节期间,约62
2025-10-09 21:49:00
NBA中国携手阿里云开启多年合作,球迷互动体验新惊喜在哪?
10月9日,NBA中国和阿里云宣布达成多年合作,阿里云将正式成为NBA中国官方云计算与人工智能合作伙伴,基于通义千问大模型和云计算基础设施
2025-10-09 22:19:00
获充换电大会官方推荐及星级认证, 公牛充电桩全场景方案引关注
9月27日至29日,2025中国汽车充换电生态大会在合肥举行,此次大会由国家能源局电力司、安徽省汽车办、中国汽车工业协会共同指导
2025-10-09 17:04:00
“北京榜样•最美互联网从业者”提名人选|我爱我家陈少亮:数字浪潮中的筑梦人
2025年的北京,秋阳穿过写字楼玻璃幕墙,在键盘上投下斑驳光影。在我爱我家集团总部技术中心,陈少亮正盯着屏幕上的数据流图
2025-10-09 17:05:00
中新经纬10月9日电 工信部网站9日消息,工业和信息化部、国家标准化管理委员会近期联合发布《云计算综合标准化体系建设指南(2025版)》(下称《指南》)
2025-10-09 13:06:00
当下,网络热搜榜单已经成为我们感知世界的一个重要窗口。这个窗口展示的内容是否真实、健康、积极,直接影响着数亿网民的认知判断
2025-10-09 10:31:00
高低2025年国庆中秋双节,中国电影市场成绩亮眼:国庆档总票房破17亿元,10月2日年度总票房达425.02亿元,超2024年全年
2025-10-09 10:49:00
厦门网讯(厦门日报记者 李晓平)如今,拍照不再停留在平面,“一站式”3D人像打印,正让影像“立”起来,成为更多人的选择
2025-10-08 08:12:00
小牛FX风速款首销战报:5小时全渠道销量14252台,以“价值重构”引爆全民抢购潮
2025年9月29日,全球高端智能电动车领导品牌小牛电动正式发布FX风速款首销战报。数据显示,这款被业界称为“价格屠夫”的新品在9月28日首发后
2025-10-08 09:00:00
稳就业 稳企业 稳市场 稳预期|从 “设备制造” 到 “全链服务”:陕西电子长岭电气纺织机电产业的进阶之路
9月29日,由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动,带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察
2025-10-08 17:51:00
近日,中国物流与采购联合会公布全国第十批5A级供应链服务企业名单,华远国际陆港集团正式通过评审,获评“5A级供应链服务企业”
2025-10-08 18:01:00
货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期,我市消费市场“热”力值拉满,处处繁荣兴旺、活力十足。10月8日
2025-10-08 18:32:00
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00