• 我的订阅
  • 头条热搜
如何让大模型输出更精准、更可靠的结果?
...生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。百融云创大模型应用一站式开发平台百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层,所以冻结这部分参数。除了用线性RNN层(Mamba)替换掉注意力头,还有一些组件需要处理...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是一个难...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...问题出错,这个得看问题的复杂程度。有部分原因是模型输出的随机性导致的(也是模型有创造力的源泉),这方面随着模型能力的增强,幻觉也会越来越小,但很难完全避免。 对于忠实性幻觉,如给定文本做摘要,这个要增...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时保持其功能完好无损。Memory3:在架构...……更多
被DeepSeek带火的知识蒸馏 开山之作曾被拒:诺奖得主坐镇都没用
...目标在softmax层加入温度参数T。当T=1时,就是普通的softmax输出。T越大,输出的概率分布越平滑(soft)。他们认为此前人们习惯性地将模型中的知识与模型的具体参数绑定在一起,因此很难想到该如何在改变模型结构的同时仍旧...……更多
万达信息申请基于大语言模型的肺部CT报告风险评估专利,提升肺部CT风险评估的效果
...文本内容,将其输入训练后的大语言模型;由大语言模型输出风险报告;临床医师对大语言模型输出的风险报告进行评价,基于评价结论获得临床人为风险评分结果;将临床人为风险评分结果以及患者后续CT进展结果作为大语言...……更多
...AI搜索体验。DeepSeek-R1模型具备强大的逻辑推演与结构化输出能力,在问答等文字生成场景中成果瞩目;知乎直答拥有社区庞大的优质语料和超过5000万篇中英文文献数据。二者结合之后,模型推理过程在社区专业可溯源语料加持...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待,...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...会检索相关段落,并使用迭代式自反馈的生成方法来优化输出;搭配的专门基准ScholarQABench旨在对开放式科学问答进行现实且可重复的评估。OpenScholar概述、ScholarQABench概述和自动化&人类专家评估结果模型概述对于OpenScholar而...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...用预训练的MultinomialNB模型对提取的文本进行分类预测,输出预测结果和置信度。 ·在图像上绘制识别到的文本,并在窗口中显示处理后的图像。 ⑤结束: ·释放摄像头设备,并关闭所有OpenCV窗口。 三、知识园地 1.了解Multinom...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全理念的培植、安全制度的学习、安全意识的...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定...……更多
...应对相对发散的对话,提供高质流畅的对话体验,为企业输出兼具高效与性价比的智能外呼产品及解决方案。百度智能云曦灵数字人平台全新集成了DeepSeek-R1模型,并在数字人视频脚本创作中率先应用。通过DeepSeek-R1模型在语义...……更多
...数据库和所述产线路线需求数据库中的数据为输入变量,输出分析数据;基于所述产线产能数字化分析模型开发网页版数字化产能分析工具,将所述分析数据通过人机交互界面进行显示和交互。本发明通过构建产线产能数字化分...……更多
天工skyagents助力大模型走入千家万户
...、多步骤处理的复杂业务,往往要么容易产生“幻觉”,输出错误回答,要么容易错步、漏步、跳步,直接输出结果。然而不幸的是,人们在现实生活中遇到的大多数问题,往往都是复杂流程任务。为了解决这一问题,「天工Sky...……更多
这个大模型,真的治好了我的论文阅读障碍
...案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。 为了验证这一新功能的效果,机器之心进行了一手实测。论文「精读」,精在哪儿?用 AI 读论文是一种怎样的体...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...二选一选择题,French,Japanese 是不定项选择题。只有模型输出完全正确时,才会被视为正样本。“Avg.” 代表这六种语言的平均准确率。 模型解释答案能力评测(ROUGE-1/BLEU-1)除了多项选择问答任务外,研究还扩展到评测各种大...……更多
...准确识别出复杂的数学公式,不仅给出完整的解题思路,输出结果也严谨清晰;在逻辑推理时全方位思考,思考可能出现的每一种假设,表现出更强的严谨性和准确性。代码能力上,星火X1不仅提高了代码生成的准确率,对生成...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
百度文心大模型4.0技术进展
...间,加快了模型迭代速度。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找...……更多
OpenAI史上最贵模型来了!比DeepSeek贵270倍
...高兴,结果一看到价格,悬着的心终于死了。100万输入/输出token价格分别为150美元和600美元对比DeepSeek模型,其输出价格整整比R1贵了270倍,以至于有网友大肆吐槽:除非其智能达到了爱因斯坦级别,否则不值得。与此同时,关...……更多
正式发布|绿盟AI大模型风险评估工具
...业应在模型上线前进行全面的合规性测试,确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻 大模型在处理大量个人和企业敏感数据时,可能会不慎泄露这些信息。为了避免此类事件发生,建议模型在上线前进行...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦,特别是使用解码器风格的大型语言模型时,具有更复杂的内部表...……更多
更多关于科技的资讯:
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00
■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系,着力打通数据壁垒与业务断点,促进产业链各环节融通发展■建立功能完善
2025-10-31 09:05:00
在数字化、网络化、智能化的当下,图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”?近日,第五届长三角公共图书馆发展论坛在上海举行
2025-10-31 09:05:00
Mutual妙趣艺:全球战略+资源整合,打造文娱IP数字资产化标杆
Mutual妙趣艺于2020年成立于美国加州,专注于文娱IP(知识产权)数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”
2025-10-31 10:57:00
鲁网10月31日讯近日,“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上,工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”
2025-10-31 11:43:00
人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,广西聚焦国家所需、广西所能、东盟所盼,正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径
2025-10-31 11:46:00
aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类供应商——以中国智造共铸无界对话的全球盛事
上海,2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛(WCGC)全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行
2025-10-31 11:52:00
让检测全面拥抱AI!科学指南针2025产品服务发布会举行
让检测全面拥抱AI!10月30日,科学指南针2025年度产品服务发布会在杭州举办,来自高校院所、企业、分析测试中心等多方行业代表到场参会
2025-10-31 11:52:00
培育钻定制哪个品牌好?2025最新测评出炉,国产珠宝高性价比领跑榜单
曾几何时,钻石承载着“钻石恒久远,一颗永流传”的爱情神话,而天然钻石的稀缺性更被赋予了极高的市场价值。然而,随着实验室培育钻石技术的突破性进展
2025-10-31 12:14:00
在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期,平台竞争力已不再局限于单一的预订功能,而是延伸至合规风控
2025-10-31 12:16:00
拓竹荣膺《时代》最佳发明,3D打印技术步入主流创新支撑体系
近期,《时代》周刊公布2025年度最佳发明榜单,揭示一个耐人寻味的现象:在300项突破性发明中,仅有4项被明确标注为3D打印创新
2025-10-31 12:19:00