• 我的订阅
  • 头条热搜
谷歌推出搜索增强事实评估器
3月31日消息,无论当下AI聊天机器人有多么强大,都会或多或少存在一大饱受诟病的行为——以看上去令人信服的方式,向用户提供与事实不符的回答。简单来说,AI有时会在回答中“满口跑火车”,甚至“造谣”。图源Pixabay防...……更多
脚步不会停止,步步关乎高教
...。在刚刚过去的2023年,人工智能取得了长足进步,聊天机器人、语言模型等在各行业的应用都取得了突破性进展,并已经改变了医疗保健、金融和教育等行业。今天Sora的出现,是过去一年人工智能发展所达到的又一个高峰。我...……更多
OpenAI入局AI搜索 SearchGPT演示中“翻车”
...行。根据知名半导体机构Semianalysis的一份报告,光AI聊天机器人ChatGPT每天的运行成本就有约69万美元,而这仅仅是计算机硬件的成本。如果考虑到运营成本、研发和人员配备费用,这个数字还会更高。近期,有外媒援引一份OpenAI...……更多
微软演示活动出现事实性错误
据报道,谷歌聊天机器人演示活动现场翻车导致其股价当天暴跌逾7%,但微软的演示活动同样出现了事实性错误。上周的科技圈掀起了一个聊天机器人的小高潮,微软和谷歌都试图通过展示早起版本的AI搜索来先发制人。微软更...……更多
Ai Pin两位高管再创业!瞄准企业AI搜索,估值2500万美元
...回答的时候拒绝回答,而不是进行编造。这是许多AI聊天机器人都在努力解决的问题。结语:解决AI搜索痛点,Infactory的未来发展当前,谷歌、微软、OpenAI和其他公司正在主导一场生成式AI军备竞赛,几乎每个行业的公司都在争先...……更多
ChatGPT背后:一个天才、百亿融资和1亿日活 | 全球独角兽
...,但几分钟又后迅速下线;2月7日,谷歌预告其智能对话机器人Brad即将上线;然而今天,北京时间2月8日,微软紧急推出由OpenAI提供技术支持的最新版Bing(中文名“必应”)搜索引擎和Edge浏览器。火从产品本身,烧到了各个领...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...地响应用户的需求,单一样本的回答质量是衡量一个聊天机器人的关键指标,但这一指标并不足以全面评估模型在允许更充裕推理时间时的综合性能。 针对以上问题,研究人员对如何在大语言模型推理过程中提高回答的多样性...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...智能发展中的一个重大挑战是确保语言模型生成的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...赖直觉而非深入的搜索和解决问题的能力。此外,模型与机器人对弈时的分数比与人类对弈时的分数要低。田渊栋认为这可能是因为人类在有限的时间内可能没有机器人那么擅长发现战术上的失误。所以,这种比赛可能并不足以...……更多
...担忧。早在AI研究公司OpenAI于2011年11月份首次推出AI聊天机器人ChatGPT三个月前,Facebook母公司Meta就曾发布过类似的聊天机器人。但Meta首席人工智能科学家雅恩・勒昆(YannLeCun)表示,与ChatGPT立即爆火、上线五天里就有100多万用...……更多
微软推出新版必应搜索引擎
...,微软宣布推出新版必应搜索引擎,并将当前爆火的聊天机器人ChatGPT的背后AI技术整合起来。与此同时,微软还推出了Edge浏览器的新AI增强功能,并承诺这两款产品将为浏览网页和在线查询信息提供新的体验。微软希望此举能够...……更多
AI“爆改”搜索引擎,搜索行业之变
...内测;而小红书也在去年推出AI群聊后,又测试了AI聊天机器人“DAVINIC”;去年12月,抖音则在主APP内测试“AI搜”的智能搜索功能。在抖音搜索界面,“AI搜”处于较高权重位置,仅次于综合、用户、视频、商品服务。小红书推...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...用户。在分析过程中,模型准确地识别出了视频中的四足机器人,并对其外观、所处的环境以及所进行的活动进行了详细的描述。GPT-4o视频测试回复 相比之下,Gemini 1.5 Pro的回复则显得简略又单调,在记者第二次追问下,才充...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(AI)领域的一个悬而未解的问题。为了测量语言模型的事实正确性,近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型事实正确性这一领域,目前该领域存在数据过时、评测不准和覆盖不全等问...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...布了ChatGPT,拉开了AI军备竞赛的序幕。ChatGPT是一款聊天机器人,最初由版本为GPT-3.5的大型语言模型驱动。OpenAI 随后在2023年推出了GPT-4,并称其更准确、更具创造性。最近,OpenAI又推出了其首个推理模型o1。该公司发言人表示,O...……更多
...放。百度计划在今年3月推出与ChatGPT类似的人工智能聊天机器人服务,最初版本将嵌入其搜索服务中。百度CEO李彦宏对于该项目的定位是“引领搜索体验的代际变革”。那么,ChatGPT为何此时大“火”?能写论文的ChatGPT对教育有...……更多
DeepSeek风暴下,产学研专家共议AI重塑传媒
...意识到AI强大的内容生成能力,同时智能算法推荐和聊天机器人等工具也在改变读者与媒体的互动方式,媒体行业智能化转型势在必行。然而,AI技术的广泛应用也带来了数据真实性、版权保护和伦理规范等挑战。如何在AI时代保...……更多
openai雇佣5名谷歌ai研究人员
在AI聊天机器人ChatGPT发布前的几个月里,其开发者OpenAI悄悄雇佣了至少5名谷歌AI研究人员。他们在帮助改进ChatGPT方面发挥了重要作用,并支持其在2022年11月份推出。谷歌拥有世界上最著名的两个AI研究团队,但OpenAI却在短时间...……更多
新闻传播业的生成式人工智能应用及其风险应对
...能的内容生成和交互水平取得突破性进展。人工智能聊天机器人程序ChatGPT、人工智能图片生成平台Midjourney和文生视频大模型Sora等生成式人工智能出现,掀起内容生产和信息消费热潮。生成式人工智能的数据训练、程序设计和生...……更多
OpenAI「补票」AI 搜索,SearchGPT 没有野心
...器幻觉问题一直存在,Perplexity 也不例外。6 月,其聊天机器人就被爆出在缺乏直接访问原文的情况下产生机器幻觉,通过 URL 和搜索引擎碎片信息重建内容,生成看似准确的摘要,实则可能包含不准确甚至完全虚构的信息。这也...……更多
国产大模型真正角逐时刻:从钉钉智能客服开始谈起
作者|桑明强“一个小小的客服机器人能有多高的社会价值?”如果把这个问题放在几年前,很多人脑海里的第一反应仍停留在电商时代中那接近傻瓜式的智能客服,这些机器人通常被设定了几个高频关键词,但一旦遇到稍难...……更多
AI教育应用潮涌 豆神端模一体新物种成功突围
...出了“端模一体”概念, ‌端模一体‌是指将大模型和机器人的端(终端设备)结合起来,形成一个整体的系统。通过端模一体化的设计,机器人的智能水平、规划能力都得到了大幅度的提升,可以根据具体场景选择合适的大...……更多
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
...I,幻觉问题仍非常难消除。豆包AI制图,关键词:匹诺曹机器人清华大学团队在2025年2月发布《DeepSeek与AI幻觉》报告,将AI幻觉分为两类,一类是事实性幻觉,指生成的内容与可验证的现实世界事实不一致。例如,模型错误地回...……更多
ChatGPT竞品机器人Bard出师不利,谷歌股价跌超8%
在ChatGPT竞品机器人Bard出师不利回答出错后,谷歌的管理层现在好像“里外不是人”:外有投资者大举抛售,让股价创2008年来最大两日跌幅、市值由此蒸发约2000亿美元,内有员工抨击。当地时间2月10日周五,媒体发现,谷歌的...……更多
IDC首次发布移动端大模型应用市场竞争力分析研究报告
...竞争力分析研究报告,评估了市场上 8 款热门 Chatbot 聊天机器人模型,并分析、洞察了相关 AI 模型的性能和特征。 IT之家附上本次评估的 8 款 Chatbot App 如下(按照公司拼音首字母顺序排列):kimi 智能助手 豆包 海螺 AI 天工 ...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...方案,结合了自动指标和人工评估,以衡量引文准确性、事实正确性、内容覆盖率、连贯性和整体质量,确保评估的稳健和可重复性。 SchlarQA-CS的数据样例和评估概述评估结果评估中使用了开放权重模型Llama 3.1(8B、70B)以及专...……更多
打造全球智能消费决策社区,「阿尔特科技」希望提供“像闺蜜一样”有针对性的消费决策辅助 | 早期项目
...,以便收集消费决策转化率、用户对推荐的满意度、聊天机器人反馈等数据。该团队计划根据公测结果进一步优化模型和App设计,逐步迭代版本,或将在12月24日全面上线。团队协作开发、优化软件 | 图片来源:阿尔特科技「阿...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...top K 值等),可以通过调整它来提升模型的性能。但是,事实证明人工提示词工程费时费力,还需要用户对提示词的结构和模型行为都有很好的理解。对于某些任务而言,我们也很难准确而简洁地传达指令。另外,人类也没有能...……更多
微软的AI赌局,谷歌为何没敢接
...用维基百科:“ChatGPT是由OpenAl开发的一个人工智能聊天机器人程序,于2022年11月推出……”百度则会筛选搜索内容,并摘取答案直接回答在第一条的显著位置:“聊天机器人,chatgpt是OpenAl开发的一个大型预训练语言模型……”...……更多
中国AI专利最多的5个公司!华为第5,平安第3,腾讯第1
...控制、配电用网、智能配电电压器、系统能源、智能巡检机器人等多方面。国家电网的专利战略集中在机器学习 以及人工智能应用场景等相关技术分支,展现了其在智能电网和能源管理领域的技术实力和创新能力。AI技术在电网...……更多
更多关于科技的资讯:
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(二):技术创新共享给安平丝网带来了什么
技术创新共享给安平丝网带来了什么——河北特色产业集群共享智造故事(二)11月21日,安平县高新区绿色产业园区,河北丝筘金属制品有限公司车间里
2025-11-27 08:12:00
海底捞、阿嬷手作等品牌接入,顺丰同城“独享专送”餐饮品类单量同比激增3倍
随着即时零售市场的持续扩张和竞争深化,消费者对即时配送的需求正从“送达”向“送好”升级,推动即时配送加速服务分层,以准时
2025-11-27 08:16:00
风格各异的手作店、静谧雅致的咖啡馆、独具韵味的民宿……如今,在河北很多城市的街头巷尾,小店经济快速发展,在促进消费、扩大就业
2025-11-27 09:02:00
济南海尔第九届感恩月重磅启幕 以真心回馈亿万用户信赖
鲁网11月27日讯11月26日,济南海尔感恩月启动会拉开帷幕。以更加诚挚的福利、更具力度的优惠,回馈用户多年来的信赖与支持
2025-11-27 11:05:00
伽利略智能仿生四足防爆机器人EX-1重磅亮相2025中国国际应急管理展览会 开创高危环境智能作业新纪元
2025年11月18日至20日,以"新质赋能 智慧应急"为主题的2025中国国际应急管理展览会在北京国家会议中心隆重举办
2025-11-27 11:47:00
2026中国特许加盟展全年档期正式发布:两展三会贯通全年,全球特许盛宴即将启幕
由全国性行业组织中国连锁经营协会主办的中国特许加盟展公布2026全年展会规划,将继续采取全国巡展模式,以"两展三会"的形式贯通全年
2025-11-27 11:47:00
中新经纬11月27日电 题:机器人去景点“上班”,游客的快乐从哪里来?作者 周慎 中国科学技术大学科技传播系副研究员、徽州人工智能研究院院长近日
2025-11-27 12:15:00
执“碳”为尺 绘就绿色物流新图景
鲁网11月26日讯冬日清晨的泰山脚下,山东省泰安市烟草专卖局(公司)送货员刘婷正用扫码枪轻触循环周转箱上的智能芯片,“您瞧
2025-11-27 12:15:00
中新经纬11月27日电 国务院新闻办公室27日举行国务院政策例行吹风会,介绍增强消费品供需适配性进一步促进消费政策措施有关情况
2025-11-27 12:20:00
海外科技媒体Tech Times:AI助手“灵光”让难题处理“如清风拂面般轻松”
蚂蚁集团11月18日推出的全模态通用AI助手“灵光”在国内迅速出圈后,引发海外科技媒体和社交平台的关注。美国知名科技媒体《科技时代》(Tech Times)报道称
2025-11-27 14:32:00
华为新品发布会藏惊喜!来华为浏览器解锁资讯获取新方式
2025年11月25日,华为Mate 80系列|Mate X7及全场景新品发布会如期而至,这场科技盛宴备受瞩目。在首发搭载的HarmonyOS 6操作系统与Mate 80新机的双重赋能下
2025-11-27 14:41:00
胜者智选:全人成长新范式 锚定教育变革核心
从体质强健到能力培养,从AI融合到成本理性化,教育行业正迈向健康底色、核心能力、创新素养的全人培养新阶段。在此背景下,胜者教育旗下核心品牌“胜者智选”以生态化布局回应时代需求
2025-11-27 14:43:00
网易云音乐“AI写歌”功能上线测试 普通人也能“玩”音乐
近日,网易云音乐旗下网易天音“AI写歌”趣味功能上线测试,旨在用AI降低音乐创作门槛,帮助音乐人更好捕捉灵感创意的同时
2025-11-27 14:44:00
智能引领 追求卓越 ——山东中烟青岛卷烟厂制丝车间山东烟叶专线生产运行纪实
一年,足以让一颗种子破土成苗,也足以让一条产线完成从“新生”到“成熟”的淬炼。站在山东中烟有限责任公司青岛卷烟厂制丝车间山东烟叶专线投产运行一周年的节点回望
2025-11-27 14:46:00
尚美数智酒店集团深化与华为、腾讯云合作,尚客优7为年轻人打造全新一代的住宿体验
2025年11月18日,尚美数智酒店集团联合华为、腾讯云共同推出尚客优7酒店和心里美智慧酒店3.0。全新尚客优7酒店产品以"为年轻人打造自由
2025-11-27 14:49:00