• 我的订阅
  • 头条热搜
谷歌推出搜索增强事实评估器
3月31日消息,无论当下AI聊天机器人有多么强大,都会或多或少存在一大饱受诟病的行为——以看上去令人信服的方式,向用户提供与事实不符的回答。简单来说,AI有时会在回答中“满口跑火车”,甚至“造谣”。图源Pixabay防...……更多
脚步不会停止,步步关乎高教
...。在刚刚过去的2023年,人工智能取得了长足进步,聊天机器人、语言模型等在各行业的应用都取得了突破性进展,并已经改变了医疗保健、金融和教育等行业。今天Sora的出现,是过去一年人工智能发展所达到的又一个高峰。我...……更多
OpenAI入局AI搜索 SearchGPT演示中“翻车”
...行。根据知名半导体机构Semianalysis的一份报告,光AI聊天机器人ChatGPT每天的运行成本就有约69万美元,而这仅仅是计算机硬件的成本。如果考虑到运营成本、研发和人员配备费用,这个数字还会更高。近期,有外媒援引一份OpenAI...……更多
微软演示活动出现事实性错误
据报道,谷歌聊天机器人演示活动现场翻车导致其股价当天暴跌逾7%,但微软的演示活动同样出现了事实性错误。上周的科技圈掀起了一个聊天机器人的小高潮,微软和谷歌都试图通过展示早起版本的AI搜索来先发制人。微软更...……更多
Ai Pin两位高管再创业!瞄准企业AI搜索,估值2500万美元
...回答的时候拒绝回答,而不是进行编造。这是许多AI聊天机器人都在努力解决的问题。结语:解决AI搜索痛点,Infactory的未来发展当前,谷歌、微软、OpenAI和其他公司正在主导一场生成式AI军备竞赛,几乎每个行业的公司都在争先...……更多
ChatGPT背后:一个天才、百亿融资和1亿日活 | 全球独角兽
...,但几分钟又后迅速下线;2月7日,谷歌预告其智能对话机器人Brad即将上线;然而今天,北京时间2月8日,微软紧急推出由OpenAI提供技术支持的最新版Bing(中文名“必应”)搜索引擎和Edge浏览器。火从产品本身,烧到了各个领...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...地响应用户的需求,单一样本的回答质量是衡量一个聊天机器人的关键指标,但这一指标并不足以全面评估模型在允许更充裕推理时间时的综合性能。 针对以上问题,研究人员对如何在大语言模型推理过程中提高回答的多样性...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...智能发展中的一个重大挑战是确保语言模型生成的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...赖直觉而非深入的搜索和解决问题的能力。此外,模型与机器人对弈时的分数比与人类对弈时的分数要低。田渊栋认为这可能是因为人类在有限的时间内可能没有机器人那么擅长发现战术上的失误。所以,这种比赛可能并不足以...……更多
...担忧。早在AI研究公司OpenAI于2011年11月份首次推出AI聊天机器人ChatGPT三个月前,Facebook母公司Meta就曾发布过类似的聊天机器人。但Meta首席人工智能科学家雅恩・勒昆(YannLeCun)表示,与ChatGPT立即爆火、上线五天里就有100多万用...……更多
微软推出新版必应搜索引擎
...,微软宣布推出新版必应搜索引擎,并将当前爆火的聊天机器人ChatGPT的背后AI技术整合起来。与此同时,微软还推出了Edge浏览器的新AI增强功能,并承诺这两款产品将为浏览网页和在线查询信息提供新的体验。微软希望此举能够...……更多
AI“爆改”搜索引擎,搜索行业之变
...内测;而小红书也在去年推出AI群聊后,又测试了AI聊天机器人“DAVINIC”;去年12月,抖音则在主APP内测试“AI搜”的智能搜索功能。在抖音搜索界面,“AI搜”处于较高权重位置,仅次于综合、用户、视频、商品服务。小红书推...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...用户。在分析过程中,模型准确地识别出了视频中的四足机器人,并对其外观、所处的环境以及所进行的活动进行了详细的描述。GPT-4o视频测试回复 相比之下,Gemini 1.5 Pro的回复则显得简略又单调,在记者第二次追问下,才充...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...布了ChatGPT,拉开了AI军备竞赛的序幕。ChatGPT是一款聊天机器人,最初由版本为GPT-3.5的大型语言模型驱动。OpenAI 随后在2023年推出了GPT-4,并称其更准确、更具创造性。最近,OpenAI又推出了其首个推理模型o1。该公司发言人表示,O...……更多
...放。百度计划在今年3月推出与ChatGPT类似的人工智能聊天机器人服务,最初版本将嵌入其搜索服务中。百度CEO李彦宏对于该项目的定位是“引领搜索体验的代际变革”。那么,ChatGPT为何此时大“火”?能写论文的ChatGPT对教育有...……更多
DeepSeek风暴下,产学研专家共议AI重塑传媒
...意识到AI强大的内容生成能力,同时智能算法推荐和聊天机器人等工具也在改变读者与媒体的互动方式,媒体行业智能化转型势在必行。然而,AI技术的广泛应用也带来了数据真实性、版权保护和伦理规范等挑战。如何在AI时代保...……更多
openai雇佣5名谷歌ai研究人员
在AI聊天机器人ChatGPT发布前的几个月里,其开发者OpenAI悄悄雇佣了至少5名谷歌AI研究人员。他们在帮助改进ChatGPT方面发挥了重要作用,并支持其在2022年11月份推出。谷歌拥有世界上最著名的两个AI研究团队,但OpenAI却在短时间...……更多
新闻传播业的生成式人工智能应用及其风险应对
...能的内容生成和交互水平取得突破性进展。人工智能聊天机器人程序ChatGPT、人工智能图片生成平台Midjourney和文生视频大模型Sora等生成式人工智能出现,掀起内容生产和信息消费热潮。生成式人工智能的数据训练、程序设计和生...……更多
OpenAI「补票」AI 搜索,SearchGPT 没有野心
...器幻觉问题一直存在,Perplexity 也不例外。6 月,其聊天机器人就被爆出在缺乏直接访问原文的情况下产生机器幻觉,通过 URL 和搜索引擎碎片信息重建内容,生成看似准确的摘要,实则可能包含不准确甚至完全虚构的信息。这也...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
作者|桑明强“一个小小的客服机器人能有多高的社会价值?”如果把这个问题放在几年前,很多人脑海里的第一反应仍停留在电商时代中那接近傻瓜式的智能客服,这些机器人通常被设定了几个高频关键词,但一旦遇到稍难...……更多
AI教育应用潮涌 豆神端模一体新物种成功突围
...出了“端模一体”概念, ‌端模一体‌是指将大模型和机器人的端(终端设备)结合起来,形成一个整体的系统。通过端模一体化的设计,机器人的智能水平、规划能力都得到了大幅度的提升,可以根据具体场景选择合适的大...……更多
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
...I,幻觉问题仍非常难消除。豆包AI制图,关键词:匹诺曹机器人清华大学团队在2025年2月发布《DeepSeek与AI幻觉》报告,将AI幻觉分为两类,一类是事实性幻觉,指生成的内容与可验证的现实世界事实不一致。例如,模型错误地回...……更多
ChatGPT竞品机器人Bard出师不利,谷歌股价跌超8%
在ChatGPT竞品机器人Bard出师不利回答出错后,谷歌的管理层现在好像“里外不是人”:外有投资者大举抛售,让股价创2008年来最大两日跌幅、市值由此蒸发约2000亿美元,内有员工抨击。当地时间2月10日周五,媒体发现,谷歌的...……更多
IDC首次发布移动端大模型应用市场竞争力分析研究报告
...竞争力分析研究报告,评估了市场上 8 款热门 Chatbot 聊天机器人模型,并分析、洞察了相关 AI 模型的性能和特征。 IT之家附上本次评估的 8 款 Chatbot App 如下(按照公司拼音首字母顺序排列):kimi 智能助手 豆包 海螺 AI 天工 ...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...方案,结合了自动指标和人工评估,以衡量引文准确性、事实正确性、内容覆盖率、连贯性和整体质量,确保评估的稳健和可重复性。 SchlarQA-CS的数据样例和评估概述评估结果评估中使用了开放权重模型Llama 3.1(8B、70B)以及专...……更多
打造全球智能消费决策社区,「阿尔特科技」希望提供“像闺蜜一样”有针对性的消费决策辅助 | 早期项目
...,以便收集消费决策转化率、用户对推荐的满意度、聊天机器人反馈等数据。该团队计划根据公测结果进一步优化模型和App设计,逐步迭代版本,或将在12月24日全面上线。团队协作开发、优化软件 | 图片来源:阿尔特科技「阿...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...top K 值等),可以通过调整它来提升模型的性能。但是,事实证明人工提示词工程费时费力,还需要用户对提示词的结构和模型行为都有很好的理解。对于某些任务而言,我们也很难准确而简洁地传达指令。另外,人类也没有能...……更多
微软的AI赌局,谷歌为何没敢接
...用维基百科:“ChatGPT是由OpenAl开发的一个人工智能聊天机器人程序,于2022年11月推出……”百度则会筛选搜索内容,并摘取答案直接回答在第一条的显著位置:“聊天机器人,chatgpt是OpenAl开发的一个大型预训练语言模型……”...……更多
中国AI专利最多的5个公司!华为第5,平安第3,腾讯第1
...控制、配电用网、智能配电电压器、系统能源、智能巡检机器人等多方面。国家电网的专利战略集中在机器学习 以及人工智能应用场景等相关技术分支,展现了其在智能电网和能源管理领域的技术实力和创新能力。AI技术在电网...……更多
更多关于科技的资讯:
聚焦服务品质 福州千名经纪人共赴贝壳福州站搏学大考
贝壳福州站搏学大考考场11月19日,贝壳找房福州站第26届新经纪品牌搏学大考正式拉开序幕,福州数千名房产经纪人通过线下机考的形式完成了本届搏学大考
2025-11-20 13:38:00
当输入一句简单指令,AI就能在几秒内给新鲜水果添上霉斑、给完好衣物制造破洞,这样的技术能力如今却成了少数人薅商家羊毛的利器
2025-11-20 11:16:00
发展新质生产力 推进新型工业化11月18日至25日,全球半导体行业盛会——德国慕尼黑半导体展览会隆重举行。总部位于太原的山西天成半导体材料有限公司受邀参展
2025-11-20 06:54:00
第二届雷克沙杯高校电竞挑战赛总决赛落幕
2025年11月16日,2025雷克沙杯高校电竞挑战赛全国总决赛于“电竞重镇”成都圆满收官。本届赛事由国际高端消费类存储品牌雷克沙主办
2025-11-19 08:26:00
厦门网讯(厦门日报记者 谢瑞真)新闻工作者普遍面临用眼过度、睡眠不足等问题,长时间用眼导致眼部健康问题频发。昨日,国内首份聚焦媒体从业者的眼健康报告——《厦门市新闻工作者眼健康白皮书》(以下简称“白皮书”)正式发布
2025-11-19 08:46:00
邮储银行临沂市蒙阴县支行成功举办“智享理财 共筑财富”主题沙龙活动
鲁网11月18日讯为积极践行“金融为民”服务理念,精准满足广大客户多元化财富管理需求,搭建专业高效的金融交流平台,近日
2025-11-19 09:27:00
“具身智能”开辟青年创业新赛道
原标题:政策东风助力产业发展 年轻团队研发“灵巧手” 产品销量一年增长五倍“具身智能”开辟青年创业新赛道11月17日,中国共产党北京市第十三届委员会第七次全体会议召开
2025-11-19 10:57:00
大皖新闻讯 11月19日,记者从合肥市召开的新闻发布会获悉,“十四五”以来,合肥市以科技创新引领产业创新,获批2个国家级制造业创新中心
2025-11-19 14:05:00
“双十一”最后一公里日均单量远超去年峰值,顺丰同城联动无人车、公交车末端提效
第17个“双十一”落幕,星图数据显示,本届大促综合电商平台销售额为1.619万亿元,同比增长12.3%;即时零售成为今年最大黑马
2025-11-19 14:28:00
阿里千问App支持119种语言,上线全新实时翻译能力
11月19日,阿里千问App在公测三天后,迅速推出多项翻译能力升级。基于Qwen模型的多语言能力,千问App推出全新实时翻译功能
2025-11-19 14:55:00
再绽国际舞台!柏星龙创意包装斩获2025年度五项Pentawards大奖
摘要:2025年Pentawards全球获奖名单揭晓,深圳市柏星龙创意包装股份有限公司报送的五件作品从全球数千件参赛作品中突围
2025-11-19 16:37:00
中新经纬11月19日电 11月19日,工业和信息化部举行新闻发布会,介绍GB 6675《玩具安全》系列强制性国家标准修订情况
2025-11-19 16:58:00
你开店,我出钱!郑州用“青春计划”留住年轻人
大河网讯(记者 赵檬)11月18日,由共青团郑州市委联合市委金融办、市人社局等六部门推出的“商都新活力·青春小店成长计划”正式启动
2025-11-19 17:01:00
鲁网11月19日讯2025年11月1日至2025年11月30日,中国银行泰安分行开展“臻享新户礼遇,尽享美好生活”主题活动
2025-11-19 17:14:00
为啥爆款短剧都爱用它?
大河网讯(记者 赵檬)打开手机刷几分钟短剧,早已成为不少人碎片时间的标配。从手机拍摄到专业设备加持,从流量博弈到内容为王
2025-11-19 17:32:00