• 我的订阅
  • 头条热搜
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...息,标准做法是使用T5编码器或CLIP文本编码器的最后一层输出,或是结合倒数第二层的输出,不过,研究人员发现选择用于调节文本转图像模型的最佳层非常麻烦,特别是使用解码器风格的大型语言模型时,具有更复杂的内部表...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...个简单的线性层将门控扩散卷积层和多层次关联注入层的输出进行整合,最终生成的时空依赖性特征表示为为应对可能在各种城市场景中出现的复杂情况,本文设计的时空编码器在处理空间相关性时不依赖于特定的图结构。这是...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...些代码,以阻止返回某些结果。因此,你可能只是在某些输出周围建立了防火墙。但量化可能使这些最近的编辑消失,它们太微小而无法保留。值得一提的是,团队提出了一种缓解此问题的策略。这种策略通过构建模块级别的显...……更多
中金公司信息技术部执行负责人王缅:金融行业做好客户服务的标准化和定制化可通过大模型更好实现
...模,同时又要综合考虑算力和算法两个快速变化的变量对输出结果带来的不确定影响。此外,大模型的输出标准相对比较模糊,当前阶段存在模型'幻觉',但是金融服务对于输出结果要求相对准确、严肃,两者之间存在一定矛盾...……更多
梦想当燃|浪潮云海若大模型团队:从“0”开始,前进不会止步
...局限性和实时性方面的问题,从而生成更准确、更丰富的输出结果。同时,团队也突破了提示工程技术,实现了精确引导大模型输出的能力,帮助大模型更准确地理解人类需求、生成更符合人类期望的结果。团队成员还突破了语...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...GPU小时(105-107个),并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练(也称为第二阶段预训练)将使用全新的、未见过的领域数据进一步训练基础模型。 这里,同样使用与初始预训练相同...……更多
...器学习将学习迭代后符合系统设置的指标体系标准的结果输出或存储,这就是机器学习的结果。因此,应用同一型号的学习机器在相同时空执行相同学习任务后的结果往往是一样的。人类学习则基于自己的偏好,蕴含更多情感,...……更多
让大模型“外挂硬盘”,百川智能发布新API系列,企业定制成本大大降低
...础上首创了Self-Critique大模型自省技术——以让大模型在输出答案之前“再自检”,给用户筛选出最优质的答案。最终结果是,将搜索增强知识库和超长上下文窗口结合后,模型“接上外挂”,就可以连接全部企业知识库以及全...……更多
BEV“超融合”感知部署 轻舟智航迈出量产从0到1的关键一步
...论在任何城市、时段、天气中,都能够保证无差别的功能输出,同时在遇到各类复杂的长尾场景时也能提供稳定出色的用户体验。其中,感知是最上游、最关键的能力。目前,视觉感知方案是市场和产品的主流需求。因此,基于...……更多
被认为国产AI之光的DeepSeek V3出糗:居然自称是ChatGPT
...成本。于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……不过DeepSeek V3并非是第一个出现“报错家门”的大模型。 例如Gemini就曾说过自己是百度的文...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...表示通过编码器frm中的MLP层可以获得: 其中frm编码器将输出token表示的最大、最小、平均的池化级联到一个向量空间中作为新知识表示。然后连续prompt表示pkt可以被其他初始化的MLP层实现:最终知识检索仓库被从Kt-1更新到Kt基...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...好优化进行多轮对齐。并加入安全缓解数据,保障模型的输出既安全又实用。这在期间,模型所使用的高质量微调数据,正是来自合成数据生成技术——使用Llama 3.1模型在领域内图像的基础上过滤和增强问题答案,并使用奖励模...……更多
openai推出gpt-4turbo:比上代便宜三倍
...容易让模型调用Json和XML内容,使模型更容易返回一致的输出结果,从而实现可重复输出,对控制模型行为、编写模型单元测试内容有一定作用。GPT-4Turbo还支持图像输入,集成DALL・E3,可自动总结图片内容及带有图片的文档内容...……更多
新视角设计下一代时序基础模型,Salesforce推出Moirai-MoE
...更细粒度的专业化:该方法为特定频率设计单独的输入 / 输出投影层,从而实现特定频率的模型专业化。作者认为,这种人为强加的频率级专业化缺乏普适性,并引入了一些局限性。(1)频率并不总是一个可靠的指标,无法有...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了一个全新的“安全输入但不安全输出”(SIUO),涉及道德、危险行为、自残、...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...大语言模型都卷起来了,模型越做越大,token越来越多,输出越来越长。那么问题来了,如何有效地评估大语言模型的长篇大论呢?要是输出长度长了但胡言乱语输出质量差,又臭又长,岂不是白搭?首先能想到的方法就是人工评...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...在多步骤推理中,它能将时间序列数据转化为具体的数值输出,供下一个推理步骤使用。3. 自定义模块生成器:在遇到用户提供的特定约束或外部知识时,TS-Reasoner会调用自定义模块生成器。该模块基于LLM解析用户的自然语言输...……更多
大模型是否有推理能力?DeepMind数月前的论文让AI社区吵起来了
...sformer 作为主干来参数化离散概率分布,并对 transformer 的输出应用 log-softmax 层进行归一化。因此,模型输出对数概率。在动作 - 值预测中,上下文大小为 79,而在状态 - 值预测和行为克隆中,上下文大小为 78。对于动作和状态 -...……更多
Kimi K2 + SunwayLink,让智能倍增释放
...一步扩展,适用于复杂业务场景。K2的JSON Mode确保结构化输出,完美适配企业级API交互需求。SunwayLink的企业应用集成能力得到进一步提升。② 长上下文优化128K上下文窗口结合SunwayLink的动态记忆管理,可处理超长合同、技术文档...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...识增强技术与外部知识库进行交互,以补充和约束模型的输出,从而提高信息的准确性和完整性。长文本建模技术:通过长文本建模和切片方式突破大模型输入限制,以适配媒体领域文章过长场景。提示工程:构建单步和多步的...……更多
到钉钉播种 AI 应用的,不只大模型厂商们
...柜 CIO 陈志永刚接触大模型时,还只是用来查资料并快速输出一些内容,他并不认为大模型会和自己的业务有什么实质交集。直到陈志永开始听说 AI Agent,能实现一些企业场景里的需求,AI 应用的种子开始在这家公司的「老问题...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
...方程中的 x(如下表 9 所示)。研究者确保没有查询需要输出分数。并且,为了使 7B 和 35B 模型之间的结果更具可比性,他们对这两个模型使用了相同的斜率问题。 对于 40 个事实问题,研究者确保模型一半回答正确,一半错误...……更多
...够更好地理解教育领域特定的术语、概念和规则,保证了输出内容的专业性、可解释性及准确性。教育垂类大模型推动教育主体、模式和内容发生范式变革教育垂类大模型的应用和推广,能够推动教育的主体、模式和内容变革跃...……更多
中关村科金1+N新品系列亮相,为企业打造大模型强人工智能应用
...等应用开发工具。五重安全体系、上百种安全策略,保障输出内容合规可控。帮助企业快捷、高效、安全打造个性化大模型应用。未来,中关村科金将坚持探索前沿人工智能技术与千行百业应用场景的落地融合,帮助企业和开发...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...,在 OpenAI 的博客中,其实说法是这样的:在某些格式的输出下,GPT-4 Turbo 会比 GPT-4 结果更好。那么总体情况会如何?在新模型发布的 24 小时内,就有研究者在 Aider 上进行了 AI 生成代码的能力测试。 在 gpt-4-1106-preview 模型上...……更多
2023金融大模型报告|重塑金融科技
...科技相关负责人表示,大模型发展难点不在于模型设计与输出管控,而在于模型投入与用户交互后,最终输出答案是否可信,是否合规。对此,奇富科技主要通过模型对抗算法来强化内容输出的可用性和真实度,以求形成可信大...……更多
杭州海兴电力申请双模组网方法及系统专利,提高双模组网通信整体效率
...:构建组网异常识别模型,模型的输入为组网监测数据,输出为各站点的组网状态预测结果,并基于历史组网监测数据对组网异常识别模型进行训练;当到达站点的预设入网时间时,站点优先采用载波方式申请入网;将实时获取...……更多
AI业务收入盈利双增,但百融云没有止步
...国度,什么样的AI业务最能抢滩登陆?又是什么样的AI大模型,会是应用端的翘楚? 百融云的MaaS(模型即服务)和BaaS(业务即服务)业务,都基于自研BR-LLM大模型。让中国的B端机构客户多用AI、用好AI,是百融云的出发点。相...……更多
人工智能为了游戏获胜会“说谎”
...大模型安全的重点是内容为本,也就是大模型内容的输入输出,这是大模型安全的核心。在内容为主的防御思路下,360提出了“安全原生”的技术路线,意思是说大模型内容的安全更多依靠原生在大模型内部的机制解决,而不是...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...的表示。这是由于 LLM 的文本理解能力隐藏在内部,它的输出特征空间并不具备很好的特征可分性。于是,该团队设计了一个图像 caption 到 caption 的检索实验,使用 COCO 数据集上同一张图像的两个不同 caption 互相作为正样本进行...……更多
更多关于科技的资讯:
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00