• 我的订阅
  • 头条热搜
如何让大模型输出更精准、更可靠的结果?
...生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。百融云创大模型应用一站式开发平台百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层,所以冻结这部分参数。除了用线性RNN层(Mamba)替换掉注意力头,还有一些组件需要处理...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是一个难...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉,如给定文本做摘要,这个要增...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时保持其功能完好无损。Memory3:在架构...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)。他们认为此前人们习惯性地将模型中的知识与模型的具体参数绑定在一起,因此很难想到该如何在改变模型结构的同时仍旧...……更多
万达信息申请基于大语言模型的肺部CT报告风险评估专利,提升肺部CT风险评估的效果
...文本内容,将其输入训练后的大语言模型;由大语言模型输出风险报告;临床医师对大语言模型输出的风险报告进行评价,基于评价结论获得临床人为风险评分结果;将临床人为风险评分结果以及患者后续CT进展结果作为大语言...……更多
...AI搜索体验。DeepSeek-R1模型具备强大的逻辑推演与结构化输出能力,在问答等文字生成场景中成果瞩目;知乎直答拥有社区庞大的优质语料和超过5000万篇中英文文献数据。二者结合之后,模型推理过程在社区专业可溯源语料加持...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待,...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...会检索相关段落,并使用迭代式自反馈的生成方法来优化输出;搭配的专门基准ScholarQABench旨在对开放式科学问答进行现实且可重复的评估。OpenScholar概述、ScholarQABench概述和自动化&人类专家评估结果模型概述对于OpenScholar而...……更多
...和实现工作,涵盖从数据输入解析、用户问题识别到结果输出的全过程。信息科学与工程学院博士研究生缪钰杰作为参与研发的人员之一,重点保障模型在知识理解、逻辑推理以及输出结果可追溯性和可靠性方面的稳定表现。他...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...用预训练的MultinomialNB模型对提取的文本进行分类预测,输出预测结果和置信度。 ·在图像上绘制识别到的文本,并在窗口中显示处理后的图像。 ⑤结束: ·释放摄像头设备,并关闭所有OpenCV窗口。 三、知识园地 1.了解Multinom...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全理念的培植、安全制度的学习、安全意识的...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定...……更多
...应对相对发散的对话,提供高质流畅的对话体验,为企业输出兼具高效与性价比的智能外呼产品及解决方案。百度智能云曦灵数字人平台全新集成了DeepSeek-R1模型,并在数字人视频脚本创作中率先应用。通过DeepSeek-R1模型在语义...……更多
...数据库和所述产线路线需求数据库中的数据为输入变量,输出分析数据;基于所述产线产能数字化分析模型开发网页版数字化产能分析工具,将所述分析数据通过人机交互界面进行显示和交互。本发明通过构建产线产能数字化分...……更多
天工skyagents助力大模型走入千家万户
...、多步骤处理的复杂业务,往往要么容易产生“幻觉”,输出错误回答,要么容易错步、漏步、跳步,直接输出结果。然而不幸的是,人们在现实生活中遇到的大多数问题,往往都是复杂流程任务。为了解决这一问题,「天工Sky...……更多
这个大模型,真的治好了我的论文阅读障碍
...案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。 为了验证这一新功能的效果,机器之心进行了一手实测。论文「精读」,精在哪儿?用 AI 读论文是一种怎样的体...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...二选一选择题,French,Japanese 是不定项选择题。只有模型输出完全正确时,才会被视为正样本。“Avg.” 代表这六种语言的平均准确率。 模型解释答案能力评测(ROUGE-1/BLEU-1)除了多项选择问答任务外,研究还扩展到评测各种大...……更多
...准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
百度文心大模型4.0技术进展
...间,加快了模型迭代速度。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找...……更多
OpenAI史上最贵模型来了!比DeepSeek贵270倍
...高兴,结果一看到价格,悬着的心终于死了。100万输入/输出token价格分别为150美元和600美元对比DeepSeek模型,其输出价格整整比R1贵了270倍,以至于有网友大肆吐槽:除非其智能达到了爱因斯坦级别,否则不值得。与此同时,关...……更多
正式发布|绿盟AI大模型风险评估工具
...业应在模型上线前进行全面的合规性测试,确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻 大模型在处理大量个人和企业敏感数据时,可能会不慎泄露这些信息。为了避免此类事件发生,建议模型在上线前进行...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具...……更多
更多关于科技的资讯:
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00
用一张照片告别2025:富士胶片X-SPACE三城点亮\
2025年11月起,富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动
2025-12-04 11:49:00
《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比”等关键词
2025年10月20-23日,第33届深圳礼品家居展于深圳国际会展中心举办,展会同期进行的2025中国礼业高峰论坛上,展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》
2025-12-04 11:55:00
中国网12月4日讯 据国家体育总局网站消息,体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出,有序促进职业篮球开放
2025-12-04 12:16:00
长白时评评论员 刘颂寒12月1日,电视剧《家业》和制片方华策影视发文,谴责部分短剧投机取巧,擅自截取《家业》宣传物料中的创意元素“跟拍”
2025-12-04 13:48:00
近年来,智能制造产业园引导企业顺应数字化浪潮,积极落实智改数转,推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业
2025-12-04 11:20:00
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00