• 我的订阅
  • 头条热搜
如何让大模型输出更精准、更可靠的结果?
...生成更准确和相关的答案。这种方式不仅增强了大模型的输出质量,还避免了重新训练模型的繁琐过程。百融云创大模型应用一站式开发平台百融云创将RAG技术引入到大模型应用一站式开发平台——赛博坦,并对Q&A场景专门...……更多
百融云创荣获“2024大模型创新应用奖”
...“2024新科技100强金i奖”正式发布,百融云创荣获“2024大模型创新应用奖”。作为人工智能代表性企业,百融云创自主构建了大模型预训练、微调、推理工程优化、应用开发套件等一整套技术栈。公司2014年以决策式AI起家,2017...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...初始化。之后就是SSM的运算过程,再通过投影和累加得到输出。模型架构和训练下图给出了模型的架构,因为Transformer的知识存在于MLP层,所以冻结这部分参数。除了用线性RNN层(Mamba)替换掉注意力头,还有一些组件需要处理...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是一个难...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题时则容易产生误导性的回...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作为电路的内部机制,并将知识定义为输入输出关系及其电路。通过操纵这些电路,人们可以从 LLM 中分离出许多知识,同时保持其功能完好无损。Memory3:在架构...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...。CriticGPT同样基于GPT-4训练,但目的却是用来指正GPT-4的输出错误,实现「自我批评」。OpenAI最近的拖延症状逐渐严重,不仅GPT-5遥遥无期,前几天还宣布GPG-4o的语音功能将推迟一个月发布。或许是为了缓解广大网友的热切期待,...……更多
行空板MultinomialNB模型实现古诗词作者快速识别
...用预训练的MultinomialNB模型对提取的文本进行分类预测,输出预测结果和置信度。 ·在图像上绘制识别到的文本,并在窗口中显示处理后的图像。 ⑤结束: ·释放摄像头设备,并关闭所有OpenCV窗口。 三、知识园地 1.了解Multinom...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...ion)的方法,能让模型像OpenAI-o1一样,通过内部“思考”输出更好答案,最终只显示结果,不展示思考过程。TPO将思维链式提示/推理融入训练中:在回答之前,用思维链式方法进行思考;使用一个LLM评判来评估响应(不包括由LL...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
...是“ABC”模型?“ABC”模型(A指输入、B指心智模式、C指输出)。提高自身认知,提升心智模式,才能实现预期的输出、预期的行为、预期的结果。以安全工作为例,A输入是指:安全理念的培植、安全制度的学习、安全意识的...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...远比表现的要多。它们能够在内部编码正确答案,却依旧输出了错误内容。到现在为止,我们仍旧对大模型「幻觉」如何、为何产生,知之甚少。最近,来自Technion、谷歌和苹果的研究人员发现,LLM「真实性」的信息集中在特定...……更多
天工skyagents助力大模型走入千家万户
...、多步骤处理的复杂业务,往往要么容易产生“幻觉”,输出错误回答,要么容易错步、漏步、跳步,直接输出结果。然而不幸的是,人们在现实生活中遇到的大多数问题,往往都是复杂流程任务。为了解决这一问题,「天工Sky...……更多
...数据库和所述产线路线需求数据库中的数据为输入变量,输出分析数据;基于所述产线产能数字化分析模型开发网页版数字化产能分析工具,将所述分析数据通过人机交互界面进行显示和交互。本发明通过构建产线产能数字化分...……更多
这个大模型,真的治好了我的论文阅读障碍
...案。他们新推出的「深度阅读模式」支持长文精读,能够输出模块化的、图文并茂的解析,非常适合用来读论文。 为了验证这一新功能的效果,机器之心进行了一手实测。论文「精读」,精在哪儿?用 AI 读论文是一种怎样的体...……更多
百度CTO王海峰:文心大模型的底色和成色
...多益善。为提升大模型的准确性,文心大模型4.0在输入、输出两个阶段都运用了知识点增强,具体做法为在输入端对用户输入的问题进行理解,并拆解所需的知识点,然后在搜索引擎、知识图谱、数据库中获取准确知识,最后把...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...二选一选择题,French,Japanese 是不定项选择题。只有模型输出完全正确时,才会被视为正样本。“Avg.” 代表这六种语言的平均准确率。 模型解释答案能力评测(ROUGE-1/BLEU-1)除了多项选择问答任务外,研究还扩展到评测各种大...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
百度文心大模型4.0技术进展
...间,加快了模型迭代速度。此外,文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找...……更多
正式发布|绿盟AI大模型风险评估工具
...业应在模型上线前进行全面的合规性测试,确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻 大模型在处理大量个人和企业敏感数据时,可能会不慎泄露这些信息。为了避免此类事件发生,建议模型在上线前进行...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失,它们太微小而无法保留。值得一提的是,团队提出了一种缓解此问题的策略。这种策略通过构建模块级别的显...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦,特别是使用解码器风格的大型语言模型时,具有更复杂的内部表...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...个简单的线性层将门控扩散卷积层和多层次关联注入层的输出进行整合,最终生成的时空依赖性特征表示为为应对可能在各种城市场景中出现的复杂情况,本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...模,同时又要综合考虑算力和算法两个快速变化的变量对输出结果带来的不确定影响。此外,大模型的输出标准相对比较模糊,当前阶段存在模型\'幻觉\',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛...……更多
梦想当燃|浪潮云海若大模型团队:从“0”开始,前进不会止步
...局限性和实时性方面的问题,从而生成更准确、更丰富的输出结果。同时,团队也突破了提示工程技术,实现了精确引导大模型输出的能力,帮助大模型更准确地理解人类需求、生成更符合人类期望的结果。团队成员还突破了语...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...GPU小时(105-107个),并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练(也称为第二阶段预训练)将使用全新的、未见过的领域数据进一步训练基础模型。 这里,同样使用与初始预训练相同...……更多
...器学习将学习迭代后符合系统设置的指标体系标准的结果输出或存储,这就是机器学习的结果。因此,应用同一型号的学习机器在相同时空执行相同学习任务后的结果往往是一样的。人类学习则基于自己的偏好,蕴含更多情感,...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...础上首创了Self-Critique大模型自省技术——以让大模型在输出答案之前“再自检”,给用户筛选出最优质的答案。最终结果是,将搜索增强知识库和超长上下文窗口结合后,模型“接上外挂”,就可以连接全部企业知识库以及全...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...表示通过编码器frm中的MLP层可以获得: 其中frm编码器将输出token表示的最大、最小、平均的池化级联到一个向量空间中作为新知识表示。然后连续prompt表示pkt可以被其他初始化的MLP层实现:最终知识检索仓库被从Kt-1更新到Kt基...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...论在任何城市、时段、天气中,都能够保证无差别的功能输出,同时在遇到各类复杂的长尾场景时也能提供稳定出色的用户体验。其中,感知是最上游、最关键的能力。目前,视觉感知方案是市场和产品的主流需求。因此,基于...……更多
更多关于科技的资讯:
全国每三台冰箱、每四台洗衣机、每五台空调就有一台“安徽造”。近年来,安徽智能家电家居产业取得长足发展。从智能冰箱、空调到智能家居系统
2025-01-22 10:39:00
化妆品行业加速穿越周期向高质量发展
本报讯 (记者 王薛淄 文/摄)亿级品牌快速增加,超65%保持正增长;落后产能加速淘汰,结构不断优化;产品极大丰富,新原料备案注册再创新高……1月20日
2025-01-22 10:41:00
喜报!济南世茂广场荣获“2024年度消费风尚品牌”
齐鲁晚报·齐鲁壹点 张唯“风尚领航 美好生活+”2024(第13届)消费风尚盛典隆重揭晓。济南世茂广场凭借卓越表现,荣获“2024年度消费风尚品牌”
2025-01-22 10:45:00
深拓智能:智慧工厂引领未来
树立行业标杆,讲好中国故事,传递中国声音,充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神。近日,“崛起的民族品牌”专题系列节目对话湖南深拓智能科技股份有限公司(简称
2025-01-22 10:45:00
聚焦低空安防,高新区低空感知监视网络建设研讨会圆满召开
近期,福州高新区低空感知监视网络建设研讨会在高新区无人机(系统)孵化器成功召开。作为低空安防领域的领先企业,福建灵信信息科技有限公司受邀参会并积极参与研讨
2025-01-22 10:45:00
壹玖壹玖的2024:场景数字化,于创新中谋发展
自2006年成立以来,壹玖壹玖就是中国酒类流通行业里那个爱“折腾”的代表。比如,壹玖壹玖一开始就以“专线电话”的创新方式切入酒水零售
2025-01-22 10:46:00
你家的投影仪,“吃灰”了吗?丨睡前聊一会儿
本文转自:人民日报中央厨房-思聊工作室戴林峰睡前聊一会儿,梦中有世界。听众朋友,你好。“墙有多大,屏幕就多大”,这是投影仪广告里营造的生活小确幸
2025-01-22 11:00:00
告别玩游戏繁琐切换窗口!微软Win11 Edge游戏助手正式上线
快科技1月22日消息,微软在2024年11月首次宣布推出Edge Game Assist功能,可以让玩家在电脑上玩游戏时更轻松地浏览网页
2025-01-22 11:01:00
已致76人死亡 土耳其一度假酒店发生火灾:选址成灭火最大阻力
快科技1月22日消息,据央视新闻报道,当地时间本月21日凌晨3时30分左右,土耳其博卢省滑雪度假区一栋12层高的酒店起火
2025-01-22 11:01:00
1月15日,国新办新闻发布会介绍2024年知识产权工作进展情况。截至2024年底,我国国内拥有有效发明专利的企业达到49
2025-01-22 11:14:00
日照市行政审批服务局创新推出AI客服“阳光小政”,不断优化企业群众办事体验,提升政务服务数字化智慧化水平。一是开展智能咨询
2025-01-22 11:19:00
阿维塔买来第一天出车祸 女车主:车辆没有预警也要负责任
快科技1月22日消息,据报道,杭州的冯女士向媒体反映称,自己刚买一天的阿维塔新车发生了事故,维修费要3万多元,她认为车辆和4S店都要负一定责任
2025-01-22 11:31:00
格纹变奏设计个性十足!华为nova 13 Pro图赏
新春佳节即将带来之际,华为nova 13 Pro来到我们评测室,下面为大家带来图赏。华为nova 13系列提供洛登绿、羽砂紫
2025-01-22 11:31:00
国补4499元!小米15定制版新春献礼开售:胭脂红年味拉满
快科技1月22日消息,今日,小米15定制版“新春献礼”配色开售,售价4999元(16GB+512GB),国家补贴优惠500元
2025-01-22 11:31:00
AMD说实话了!终于知道锐龙9 9950X3D和锐龙7 9800X3D怎么选了
快科技1月22日消息,今年CES 2025大展上,AMD高端X3D神U、基于二代3D缓存技术的顶级型号——锐龙9 9950X3D 16核心
2025-01-22 11:31:00