• 我的订阅
  • 头条热搜
如何让大模型输出更精准、更可靠的结果?
...生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。百融云创大模型应用一站式开发平台百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层,所以冻结这部分参数。除了用线性RNN层(Mamba)替换掉注意力头,还有一些组件需要处理...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是一个难...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时保持其功能完好无损。Memory3:在架构...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待,...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...用预训练的MultinomialNB模型对提取的文本进行分类预测,输出预测结果和置信度。 ·在图像上绘制识别到的文本,并在窗口中显示处理后的图像。 ⑤结束: ·释放摄像头设备,并关闭所有OpenCV窗口。 三、知识园地 1.了解Multinom...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全理念的培植、安全制度的学习、安全意识的...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定...……更多
天工skyagents助力大模型走入千家万户
...、多步骤处理的复杂业务,往往要么容易产生“幻觉”,输出错误回答,要么容易错步、漏步、跳步,直接输出结果。然而不幸的是,人们在现实生活中遇到的大多数问题,往往都是复杂流程任务。为了解决这一问题,「天工Sky...……更多
...数据库和所述产线路线需求数据库中的数据为输入变量,输出分析数据;基于所述产线产能数字化分析模型开发网页版数字化产能分析工具,将所述分析数据通过人机交互界面进行显示和交互。本发明通过构建产线产能数字化分...……更多
这个大模型,真的治好了我的论文阅读障碍
...案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。 为了验证这一新功能的效果,机器之心进行了一手实测。论文「精读」,精在哪儿?用 AI 读论文是一种怎样的体...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...二选一选择题,French,Japanese 是不定项选择题。只有模型输出完全正确时,才会被视为正样本。“Avg.” 代表这六种语言的平均准确率。 模型解释答案能力评测(ROUGE-1/BLEU-1)除了多项选择问答任务外,研究还扩展到评测各种大...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
百度文心大模型4.0技术进展
...间,加快了模型迭代速度。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找...……更多
正式发布|绿盟AI大模型风险评估工具
...业应在模型上线前进行全面的合规性测试,确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻 大模型在处理大量个人和企业敏感数据时,可能会不慎泄露这些信息。为了避免此类事件发生,建议模型在上线前进行...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...的回答在事实上准确无误。当前前沿模型有时会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失,它们太微小而无法保留。值得一提的是,团队提出了一种缓解此问题的策略。这种策略通过构建模块级别的显...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦,特别是使用解码器风格的大型语言模型时,具有更复杂的内部表...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...个简单的线性层将门控扩散卷积层和多层次关联注入层的输出进行整合,最终生成的时空依赖性特征表示为为应对可能在各种城市场景中出现的复杂情况,本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...模,同时又要综合考虑算力和算法两个快速变化的变量对输出结果带来的不确定影响。此外,大模型的输出标准相对比较模糊,当前阶段存在模型\'幻觉\',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛...……更多
梦想当燃|浪潮云海若大模型团队:从“0”开始,前进不会止步
...局限性和实时性方面的问题,从而生成更准确、更丰富的输出结果。同时,团队也突破了提示工程技术,实现了精确引导大模型输出的能力,帮助大模型更准确地理解人类需求、生成更符合人类期望的结果。团队成员还突破了语...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...GPU小时(105-107个),并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练(也称为第二阶段预训练)将使用全新的、未见过的领域数据进一步训练基础模型。 这里,同样使用与初始预训练相同...……更多
...器学习将学习迭代后符合系统设置的指标体系标准的结果输出或存储,这就是机器学习的结果。因此,应用同一型号的学习机器在相同时空执行相同学习任务后的结果往往是一样的。人类学习则基于自己的偏好,蕴含更多情感,...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...础上首创了Self-Critique大模型自省技术——以让大模型在输出答案之前“再自检”,给用户筛选出最优质的答案。最终结果是,将搜索增强知识库和超长上下文窗口结合后,模型“接上外挂”,就可以连接全部企业知识库以及全...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...表示通过编码器frm中的MLP层可以获得: 其中frm编码器将输出token表示的最大、最小、平均的池化级联到一个向量空间中作为新知识表示。然后连续prompt表示pkt可以被其他初始化的MLP层实现:最终知识检索仓库被从Kt-1更新到Kt基...……更多
更多关于科技的资讯:
【观点摘登】唐方成、靳晓曼:体现用户需求的创新导向作用
随着创新开放性的日益增强和知识生产模式的发展演变,用户需求在推动科技创新、实现价值共创共享方面的作用日益突出,以识别、辨析
2025-01-29 18:18:00
本文转自:人民网人民网记者 赵竹青2025年的春节前夕,当大街小巷挂满红灯笼、家家户户忙着备年货时,国产人工智能大模型DeepSeek在海内外突然“爆火”
2025-01-29 17:42:00
大年初一,中国记协采访了DeepSeek
亲爱的粉丝们:近期,DeepSeek成为关注焦点。为了帮助大家进一步了解DeepSeek,我们与它进行了一次简短对话,希望对大家的工作有所助益(因海报容量有限
2025-01-29 16:44:00
1月28日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击,谭主向奇安信安全专家咨询并独家了解到,DeepSeek这次受到的网络攻击,IP地址都在美国。来源
2025-01-29 15:42:00
精致餐饮品牌推抖音“年夜饭”套餐,解锁“场景营销”新思路
春节前夕,年夜饭销售紧俏,主打高品质的“精致餐饮”备受欢迎。为满足消费需求,抖音生活服务联合大董烤鸭、紫薇美力集团旗下餐饮品牌鲁采LU STYLE
2025-01-29 08:40:00
2025贺新春瓣瓣同心京津冀 欢欢喜喜过大年大年初一,天津的古文化街年味浓郁。一系列新春活动,吸引天南海北的游客前来逛街赏景
2025-01-29 09:09:00
厦门网讯(厦门日报记者 朱道衡)春节来鼓浪屿要怎么玩?一天之内能否逛完,只有两个小时该怎么玩?鼓浪屿景点众多,游客该如何串联
2025-01-29 09:37:00
阿里云首次亮相总台春晚,云技术支持全球观众看直播
1月28日晚,阿里云首次亮相中央广播电视总台蛇年春晚,云技术支持全球观众观看春晚直播。作为总台春晚云计算AI独家合作伙伴
2025-01-29 13:18:00
美国科技巨头“收割者”!国产DeepSeek干掉英伟达4.3万亿市值
快科技1月28日消息,临近春节,中国人工智能公司DeepSeek突然爆火,其发布的DeepSeek-R1大模型性能上比肩OpenAI o1
2025-01-28 09:06:00
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
快科技1月28日消息,日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)
2025-01-28 10:07:00
王晶监制电影《笑傲江湖》上线爱优腾:张雨绮版东方不败来了
快科技1月28日消息,今日,电影《笑傲江湖》在腾讯视频、爱奇艺、优酷三大平台上线,同时发布“春满江湖”版海报。海报中,东方不败(张雨绮饰)侧卧雪地
2025-01-28 10:07:00
7月11日上映!DC《超人》新预告发布:只身大战反派、怪兽
快科技1月28日消息,DC全新的《超人》发布了新版预告,展示了超人翱翔于冰原之上、只身大战怪兽的场景,卢瑟等反派人物也一一登场
2025-01-28 10:37:00
快来看哪个更牛!网友热捧DeepSeek创意写春联
快科技1月28日消息,据媒体综合报道,近日,随着新春佳节的临近,一股创意写春联的热潮正在网络上悄然兴起。而在这场创意盛宴中
2025-01-28 10:37:00
李子柒将首次亮相央视《春晚》:讲述服饰的非遗故事
快科技1月28日消息,据央视频官方透露,今晚李子柒将首次亮相央视《春晚》,并担任“春晚体验官”,讲述演出服饰上的非遗故事
2025-01-28 11:07:00
育碧再次大裁员!185名员工被裁 英国工作室永久关闭
据eurogamer报道,育碧近日宣布,将关闭位于英国莱明顿的工作室,并裁减公司185个职位。部分莱明顿工作的员工将通过远程合同继续留职
2025-01-28 11:07:00