• 我的订阅
  • 头条热搜
如何让大模型输出更精准、更可靠的结果?
...生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。百融云创大模型应用一站式开发平台百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层,所以冻结这部分参数。除了用线性RNN层(Mamba)替换掉注意力头,还有一些组件需要处理...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是一个难...……更多
ChatGPT大流行的思考-解析篇
...及优化,如如何更好的分词\指代\句法分析,从而更好的输出最终任务,如这一代(袋)苹果多少钱,应该根据上下文进行判断;但GPT的出现提供了一个新的研究方向,它的理念是尝试从端到端进行解析,完全忽视中间任务的处理...……更多
大语言模型,实现智能客服知识库自动扩写功能
...,使其协同工作完成文本生成任务。框架的关键是输入与输出的有效衔接。生成多样化文本:在框架中生成多个候选扩充文本,这些文本需尽量保证多样性以提高选择空间。评估和筛选:采用自动评估与人工评估相结合的方式对...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉,如给定文本做摘要,这个要增...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时保持其功能完好无损。Memory3:在架构...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)。他们认为此前人们习惯性地将模型中的知识与模型的具体参数绑定在一起,因此很难想到该如何在改变模型结构的同时仍旧...……更多
万达信息申请基于大语言模型的肺部CT报告风险评估专利,提升肺部CT风险评估的效果
...文本内容,将其输入训练后的大语言模型;由大语言模型输出风险报告;临床医师对大语言模型输出的风险报告进行评价,基于评价结论获得临床人为风险评分结果;将临床人为风险评分结果以及患者后续CT进展结果作为大语言...……更多
深入讨论 DRD:从交互模型解析设计需求及关系
...于是提取出三个概念(图 3):(用户)输入、(系统)输出、界面。从模型二可知,系统会根据验证(不是所有输入都要验证)结果执行不同的动作和反馈不同的信息,在这里将验证的信息统称为“条件(图 4)”。所要验证...……更多
...AI搜索体验。DeepSeek-R1模型具备强大的逻辑推演与结构化输出能力,在问答等文字生成场景中成果瞩目;知乎直答拥有社区庞大的优质语料和超过5000万篇中英文文献数据。二者结合之后,模型推理过程在社区专业可溯源语料加持...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待,...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...会检索相关段落,并使用迭代式自反馈的生成方法来优化输出;搭配的专门基准ScholarQABench旨在对开放式科学问答进行现实且可重复的评估。OpenScholar概述、ScholarQABench概述和自动化&人类专家评估结果模型概述对于OpenScholar而...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...用预训练的MultinomialNB模型对提取的文本进行分类预测,输出预测结果和置信度。 ·在图像上绘制识别到的文本,并在窗口中显示处理后的图像。 ⑤结束: ·释放摄像头设备,并关闭所有OpenCV窗口。 三、知识园地 1.了解Multinom...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全理念的培植、安全制度的学习、安全意识的...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定...……更多
...应对相对发散的对话,提供高质流畅的对话体验,为企业输出兼具高效与性价比的智能外呼产品及解决方案。百度智能云曦灵数字人平台全新集成了DeepSeek-R1模型,并在数字人视频脚本创作中率先应用。通过DeepSeek-R1模型在语义...……更多
...数据库和所述产线路线需求数据库中的数据为输入变量,输出分析数据;基于所述产线产能数字化分析模型开发网页版数字化产能分析工具,将所述分析数据通过人机交互界面进行显示和交互。本发明通过构建产线产能数字化分...……更多
天工skyagents助力大模型走入千家万户
...、多步骤处理的复杂业务,往往要么容易产生“幻觉”,输出错误回答,要么容易错步、漏步、跳步,直接输出结果。然而不幸的是,人们在现实生活中遇到的大多数问题,往往都是复杂流程任务。为了解决这一问题,「天工Sky...……更多
这个大模型,真的治好了我的论文阅读障碍
...案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。 为了验证这一新功能的效果,机器之心进行了一手实测。论文「精读」,精在哪儿?用 AI 读论文是一种怎样的体...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...二选一选择题,French,Japanese 是不定项选择题。只有模型输出完全正确时,才会被视为正样本。“Avg.” 代表这六种语言的平均准确率。 模型解释答案能力评测(ROUGE-1/BLEU-1)除了多项选择问答任务外,研究还扩展到评测各种大...……更多
...准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
百度文心大模型4.0技术进展
...间,加快了模型迭代速度。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找...……更多
OpenAI史上最贵模型来了!比DeepSeek贵270倍
...高兴,结果一看到价格,悬着的心终于死了。100万输入/输出token价格分别为150美元和600美元对比DeepSeek模型,其输出价格整整比R1贵了270倍,以至于有网友大肆吐槽:除非其智能达到了爱因斯坦级别,否则不值得。与此同时,关...……更多
更多关于科技的资讯:
聚焦京津冀协同发展|一个平台,推动黄骅模具迈向高端
北京市科学技术委员会牵头,京冀相关单位共建智能模具科技成果转化中试平台一个平台,推动黄骅模具迈向高端9月11日,智能模具科技成果转化中试平台工作人员正在操作四轴机床进行生产
2025-09-23 08:49:00
AI赋能千行百业一线故事(十二):数智化转型,让电厂越来越智慧
数智化转型,让电厂越来越智慧——AI赋能千行百业一线故事(十二)8月28日,石家庄良村热电有限公司生产技术部专业主管苏朝宏介绍智慧展厅
2025-09-23 08:53:00
“产业炬光灯”系列短视频首期聚焦中材航特
“产业炬光灯”系列短视频于厦门日报官方视频号、抖音号、快手号、B站账号、央视频账号等全媒体平台同步上线,首期节目走进中材航特
2025-09-23 08:58:00
厦门网讯(厦门日报记者 林雯)旧低效工业用地加速变身科创高地。近日,随着位于思明区前埔片区的2025P13、2025P14地块成功出让
2025-09-23 08:58:00
国网厦门供电公司持续推进“EASIER用电”品牌建设
国网厦门供电公司为厦门天马微电子有限公司创造更优质、更稳定的用电环境。(国网厦门供电公司 供图)“EASIER用电”品牌厦门网讯(厦门日报记者 刘艳 通讯员 林艳婷 高芳 郭芷祎)近年来
2025-09-23 08:58:00
山东移动泰安分公司数智融合加速 赋能企业蝶变升级
鲁网9月22日讯数字化浪潮正在席卷千行百业,山东移动泰安分公司(简称:泰安移动)以“技术赋能、生态协同、梯次服务”为核心
2025-09-23 10:01:00
企鹅网络(Q学友)与腾讯云达成战略合作,携手共创“AI+职业教培”新范式
9月16日-17日,2025腾讯全球数字生态大会在深圳举办。大会期间,深圳市企鹅网络科技有限公司(以下简称“企鹅网络”)与腾讯云正式签署战略合作协议
2025-09-23 10:39:00
本报记者 赵 曦 □ 花沁昕“白天的时间都用于工作和社交,只有夜晚的时间才真正属于自己,我舍不得睡,但真想睡的时候又睡不着了
2025-09-23 10:48:00
科学为基,爱心为桥:儿童营养品牌inne携手德甲冠军俱乐部启动全球公益计划
在全民健康意识提高与消费升级的双重驱动下,新一代父母对儿童营养的重视程度前所未有。消费需求愈发细分、专业,推动儿童营养品行业从“标准化供给”向“专业化服务”转变
2025-09-23 11:20:00
《金刚狼》《权游》供应商分拆机器人数据业务,腾讯、字节大牛加入 | 智能涌现独家
文|邱晓芬编辑|苏建勋2023年底,全球出货量最大的动作捕捉设备提供商"诺亦腾(Noitom)"联合创始人戴若犁,一度以为自己被骗了
2025-09-23 20:47:00
近8成职场人每周都会使用AI工具 通用对话型AI占比最高
在人工智能技术日臻成熟的2025年,AI已不再是科幻概念或实验室产物,而是深度融入职场生态的“数字同事”。从“工具”走向“伙伴”
2025-09-23 11:37:00
罗永浩宣布“将测评预制菜”,网友:气氛都烘托到这了,要不转型做预制菜吧
9月23日凌晨,罗永浩在微博发文称,将和团队一起,对市面在售的预制菜进行测评。他表示自己“陷入了深深的思考:为什么电商网站上能买到的预制菜
2025-09-23 11:54:00
首届“洞见未来·乡村振兴共创周” 及“怀柔乡村振兴新主体联盟”启动仪式在北京怀柔成功举办
金秋九月,长城栗乡,9月20日至21日,首届“洞见未来·乡村振兴共创周”在北京市怀柔区精彩启幕。活动以“探索新路径、凝聚新合力
2025-09-23 12:10:00
当晨光洒在鲁胜公司鲁丰采油管理区林东中转站的储罐群上时,泛起了一片金属光泽。胜利油田地面工程维修中心的施工人员站在500立方米的消防水罐前
2025-09-23 12:26:00
安吉尔空间大师热销暨首创矿物质饮水机新品发布会圆满举行
9月21日,全球科技领先的净水专家安吉尔在深圳以“净水科技,全球领先”为主题,成功举办空间大师热销暨首创矿物质饮水机新品发布会
2025-09-23 14:41:00