• 我的订阅
  • 头条热搜
MIT最新研究:多个AI协作有助提高大模型推理能力和准确性
...,多个AI协作有助于提高大型语言模型的推理能力和事实准确性。·每个语言模型都生成对给定问题的回答,然后整合来自其他代理的反馈,以更新自己的回应。最终,多个模型的解决方案通过投票达成一致的最终输出。这一过...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...基础上进行任务分解和规划,给出更丰富、更具时效性和准确性的答案。而且,用户可以在简洁、标准、深入和多模型协作这4种「AI工作流」中任选其一,得到自己想要的答案模式。 比如,简单的「strawberry里有几个r」的问题...……更多
腾讯企点智能客服、营销分析全新升级,助力企业实现智慧客户管理和营销分析
...的海量信息,最终通过模型生成拟人化答案,提高回答的准确性和多样性。在人工辅助方面,智能客服能够高效提升人机协作效率。它突破了传统智能客服人工介入流程冗长的问题。在人工介入时,智能客服根据机器对话内容生...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...内容来单独验证,那么提供本书的其余部分是否会影响其准确性?上图显示了在四个短篇故事集上的模型性能,每两行为一组,上面一行表示给出整本书(约129k token)时的准确率,下面表示只给出与声明相关的部分(约21k token...……更多
百川智能发布baichuan3稳定语言模型
...普惠和平权。并且医疗问题专业性强、知识更新速度快、准确性要求高、个体差异大,能充体现大模型的各项能力,被百川智能称为“大模型皇冠上的明珠”。因此,诸如OpenAI、谷歌等头部大模型企业都将医疗作为模型的重点训...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...制的科学文献。OpenAI发现,o1 模型通过训练时和测试时,准确性会随时间平稳提高,思考越久质量越高,安全性越高。借助新的训练方法,o1模型会更加准确,AI幻觉问题减少,但依然存在,而且通过对上下文的关联分析,获得...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...组合、迭代平方和电路值问题)时,能够显著提高模型的准确性。该研究在理解 CoT 增强 Transformer 的推理能力方面提供了新的理论基础,并为未来在复杂任务中应用 Transformer 提供了新的视角。除了这篇论文,谷歌 DeepMind 在发表...……更多
科技企业竞逐“大模型”:谁能聊下去?谁更接地气? | 2023世界人工智能大会
...逻辑推理的综合能力。最新升级的“商量2.0”在知识信息准确性、逻辑判断能力、上下文理解能力、创造性等方面均有了大幅提升。“当有大量文档需要处理,如各类文章、报告、信函、产品信息等,‘商量’可以帮助进行编辑...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数据并提出新的假设。这可能会带来科学突破,包括发...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...际应用中,它能够极大地提升业务系统的数据处理效率与准确性,为企业级用户带来前所未有的数据洞察能力与业务决策支持,无疑是技术与应用双重价值并重的典范。在发布会的最后,吴名朝表示,“BI大模型要完美的融入场...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...法律、医疗或金融,微调已被证明有助于提高下游任务的准确性。以下是两个案例:- 正如本文中指出的,患者的病历包含高度敏感的数据,这些数据通常不会在公共领域中找到。因此,基于LLM的病历摘要系统需要进行微调。- ...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...答案时,Mistral Large 2 会承认(自己答不出来)。这种对准确性的追求体现在了数学基准测试中模型性能的提高,下图展示了其增强的推理和解决问题的能力:代码生成基准上的性能准确性(所有模型都通过相同的评估流程进行...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...问两部电影之间的共同主演是谁,结果显示总体上回复的准确性和一致性相对较低,甚至还有一些拆解错误。这种情况下,大语言模型很难严格遵从人类的指令。此外,大语言模型还存在事实性不足的问题。今年以来行业尝试把...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...的能力,但用到具体的实际场景,OpenAI新模型的首次输出准确性仍有很大的改进空间。实际上,Open发布的前述评测中,部分表现突出的结果都是多次测试综合得出。OpenAI称,o1模型还处于早期,未来将进行定期更新和改进,后续...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5的数据、模型、训练和推理代码都已全部开源,可复现。Ovis1.6系列中的Ovis1.6-Gemma2-9B也已开源权...……更多
海致科技推出首个知识图谱融合大模型应用平台
...使大模型能够在已有计算分析知识和图谱固化场景两个“准确性控制”下,达成以大模型推理生成为核心的精准计算问答。 ……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...提示中推理步骤数量的增加,模型在推理或逻辑任务中的准确性也会增加。这会给提示的设计方式带来一定影响,也表明更加结构化和更加逐步的方法,可以提高法学硕士在复杂推理中的表现。不过,CoT 的应用并非没有挑战。...……更多
OPPO:用AndesGPT迎接下一个十年
...的定制优化,显著提升了模型知识与百科能力的覆盖面和准确性。此外,为保证连贯持续对话中的优质体验,OPPO还提出了一些技术上的变革思路:首先,OPPO为AndesGPT引入了长时记忆机制,支持无限长度的上下文记忆,其中包括...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...、不同语言以及不同类型的逻辑和视觉推理能力进行基于准确性的细粒度评估。结果与分析分析内容主要关注Claude-3.5-Sonnet和GPT-4o,同时也对Gemini-1.5-Pro的性能表现进行了部分讨论。总体情况 表:模型在不同学科上的表现根据表...……更多
2023年度“星河产业应用创新奖”揭晓,国网智研院、宝马等10家企业项目获奖
...⻜桨 PaddleTS ,在电力场景下创新性实现新能源功率预测准确性提升,帮助新能源电厂侧最大限度减少预测发电量与实际发电量的差距。在工业行业,华晨宝马率先推出企业级大模型Agent服务平台,成功服务华晨宝马汽车有限公司...……更多
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...库索引更新,内嵌豆包向量化模型,提高搜索的相关性和准确性。除以上核心插件升级之外,火山方舟2.0也全面升级了系统承载能力、安全防护能力和算法服务能力。在系统承载力上,提供充沛的GPU算力资源,分钟级千卡扩缩容...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...”的建筑面,也能够清楚地总结户型的优劣势,但在数据准确性上有待提高。 图片来源:GPT-4o三、数据图像的分析和转换在此维度下,记者选取了一张折柱混合数据图。GPT-4o能够准确地识别数据图上的信息,并按要求以图表的...……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...,在缺乏信息时会调用搜索引擎的网页,从而保证信息的准确性。搜狐科技以近日OpenAI CEO山姆·奥特曼(Sam Altman)接受莱克斯·弗里德曼(Lex Friedman)采访的万字长文实测,输入文章网址,并要求整理出文章核心观点和所在原文...……更多
豆包大模型综合能力提升20.3%,火山引擎成立零售大模型联盟
...丰富的知识和推理能力,通过上下文感知,提升语音识别准确性,在多个公开测试集中,与国内公开发布的语音识别大模型相比,错误率最高降低40%;支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。...……更多
腾讯混元参战大模型:“幻觉率”可降低30%,多个指标超越GPT3.5
...尝试,TO C与否只是一种‘开关’,做好自身能力、提高准确性才是我们最为关注的。” ……更多
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
... DOI 与问题创建者最初分配的 DOI 进行匹配来评估回答的准确性(下图 A)。 为了执行这些标准,研究者生成了大量关于最近论文中模糊的中间发现的问题,然后排除了任何现有 AI 系统或人类注释者可以使用替代来源进行回答的...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了解决这个难题,OpenAI提出了全新训练框架Prover-Verifier Games(简称“PVG”),例如,用GPT-3这样的小模型来验证、监督,GPT-...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...决数学问题的系统,它是一个组合了自然语言处理和数学推理的系统。这个系统的作用是帮助计算机理解自然语言中的数学问题,从而能够通过推理和计算得出问题的答案。具体来说,这个系统包括多个子系统,包括自然语言处...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
更多关于科技的资讯:
索尼推出新 4K IPS 游戏显示器 INZONE M9 II,刷新率升至 160Hz
IT之家 9 月 25 日消息,除采用 OLED 面板的 INZONE M10S 外,索尼还同步更新了 4K IPS 游戏显示器产品线
2024-09-26 09:57:00
外星人推出 Alienware Pro Wireless Headset电竞耳机,售230美元
IT之家 9 月 25 日消息,科技媒体 hothardware 昨日(9 月 24 日)发布博文,报道戴尔旗下的外星人(Alienware)品牌面向专业游戏玩家和电竞选手
2024-09-26 09:58:00
联想全新拯救者 Y700 游戏平板 9 月 29 日亮相
IT之家 9 月 25 日消息,联想官方今日发文宣布,全新拯救者 Y700 游戏平板 9 月 29 日亮相,其屏幕参数现已公布
2024-09-26 09:58:00
595 元,罗德 VideoMicMe-C+ 手机指向型麦克风发布
IT之家 9 月 25 日消息,RØDE 罗德麦克风今日推出了一款 VideoMicMe-C+ 手机指向型麦克风,VideoMic Me-C+ 是一款适用于 Android 和 iOS 移动设备的麦克风
2024-09-26 09:58:00
Neurable 推出首款支持脑机接口的智能耳机,售价 699 美元
IT之家 9 月 25 日消息,Neurable 公司携手高端音响品牌 Master & Dynamic,推出了 MW75 Neuro 智能耳机
2024-09-26 09:59:00
漂亮的不像千元机!魅族新机发布:白色超窄屏+六千大电池+全路AI
虽然这段时间手机圈的热度都被华为和苹果给霸占了,但不少厂商依然选择在此时间段发布新机,比如昨天发布的iQOO Z9 Turbo+
2024-09-26 09:59:00
谜底揭晓!魅族发布千元新机,搭载友商2999元手机同款处理器
9月25日,星纪魅族举办了AI生态发布会,正式发布了Lucky系列的首款机型——魅族Lucky 08手机。价格分别为:8+256G-1599元
2024-09-26 09:59:00
细节公布!明年3月起新能源汽车也要年检了:包含增程
快科技9月26日消息,据国内媒体报道称,从明年3月开始,新能源汽车也要接受年检了。近日,国家标准《新能源汽车运行安全性能检验规程》(GB/T 44500-2024)发布
2024-09-26 07:29:00
专利密集型产品认定数浙江居全国第一每日商报讯 一件专利要转化为企业的竞争力、产业的硬实力,都离不开产品这个媒介和终端。昨天
2024-09-26 07:32:00
预制朋友圈火了!出去玩一次发五年
快科技9月26日消息,据媒体报道,微博话题“预制朋友圈”引发关注,成为社交平台上的热搜关键词。提到预制,大家首先想到的是预制菜
2024-09-26 07:59:00
《危机航线》首映礼现场:刘德华带刘涛张子枫已读乱回
快科技9月26日消息,日前,电影《危机航线》举办首映礼,演员刘德华、刘涛、张子枫、屈楚萧等参加活动。据媒体报道,刘德华带领刘涛
2024-09-26 07:59:00
首届南京博士后创新创业大赛举办,四十四个项目获奖部分项目已获投资意向,将在南京落地转化南报网讯(记者余梦娇)9月25日
2024-09-26 08:19:00
吉林一公司禁止员工带苹果设备违者开除 换华为给补助:律师、人社局回应
快科技9月26日消息,吉林一公司近日公开要求本公司员工不能携带苹果产品来上班,否则会被解雇,这引起了巨大争议。这家公司发布的《通知》中
2024-09-26 08:29:00
商报讯 国庆假期出行买不到心仪的直达票怎么办?买到的转乘组合不合心怎么办?不妨来看看这项新功能!最近,12306app推出了项“车内换座”功能
2024-09-26 08:33:00
杭州日报讯 近日,一架搭载着快递包裹的无人机飞行至余杭区梦想小镇上空,随后缓缓降落在创业集市北立体停车楼2层的起降场。现场专业管理人员将包裹取下后
2024-09-26 08:33:00