• 我的订阅
  • 头条热搜
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。 例如在预设条件的写诗任务(例如第二句的最后一个单词需要以i收尾)中,“拿起笔就写”的GPT-4o的确给出了回答,但往往只会满足了一部分条件,同时不会...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...知系统运行,比如通过一系列的神经网络层,并产生一个输出的过程。 对于任何一个单一输入,通常只有一个输出,但在很多情况下,对于一个感知输入,可能存在多种可能的输出解释。你需要的是不仅仅计算单一函数,而是...……更多
...区别主要在于,该系列模型是在思考之后回答用户问题,输出高质量的内容,而非迅速回应无效答案,即用模仿人类思维过程的“慢思考”代替过去追求快速响应的“快思考”,这与国内一家大模型企业在近两个月前提出的观点...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...时,LLM 通常依赖记住特定的表达式及其对应结果的方式输出算术问题的结果。通过简单的实验发现,LLM 只在语言层面表达了对算术运算的逻辑理解,但并没有运用计算逻辑解决算术问题,这对 LLM 在相关领域中的应用造成了重...……更多
openai回应gpt-4o升级版:非颠覆性的全新模型
...可处理多达128,000个标记(相当于约96,000个单词),并在输出能力上实现了显著提升,单次输出可达16,384个标记(或约12,288个单词),这一数字几乎是旧版GPT-4o的四倍。但关于ChatGPT实际性能与能力提升的具体细节,OpenAI依然守口...……更多
谷歌推出cappy模型打分框架,主要用于检测模型输出的内容
...架,该框架以RoBERTa语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。▲图源谷歌官方新闻稿(下同)此外,Cappy框架也可以作为大语言模型的...……更多
全球首个中药全产业链大模型“本草智库”问世
...,具备了中药知识的提取与生成、中药垂直领域解决方案输出、中药产业一站式数字化服务三大功能。“本草智库大模型的成功发布不仅是中药产业数字化转型的重要里程碑,更是跨学科合作巨大潜力的体现。”陈伟说,随着本...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...对其生成的错误陈述非常“自信”(即错误陈述在模型的输出概率分布中占主导地位),那么这些陈述的熵值可能并不会很高。最后总结一下,从大模型的内容生成机制上看,“幻觉”问题没办法 100%避免。当我们在使用AI生成...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...,可处理多格式、多文件、长记忆文档;AI精读支持图文输出、知识图谱总结、延伸阅读推荐,有助于提升学习深度和广度。此外,腾讯元宝提供了角色对话、剧情互动、剧照cos等更多玩法。例如智能体应用AI角色对话成为了腾...……更多
科学家开发预测等离子体撕裂AI模型,攻克核聚变反应的不稳定问题
...施上首次成功地实现净能量增益,从而证明了通过核聚变输出净能量的可行性。不仅如此,利用托卡马克进行核聚变也迎来重要突破。例如,2021 年底,中国科学院等离子体物理研究所的全超导托卡马克核聚变实验装置 EAST,实...……更多
2023金融大模型报告|重塑金融科技
...科技相关负责人表示,大模型发展难点不在于模型设计与输出管控,而在于模型投入与用户交互后,最终输出答案是否可信,是否合规。对此,奇富科技主要通过模型对抗算法来强化内容输出的可用性和真实度,以求形成可信大...……更多
Nature封面:AI训AI 越训越傻
...之前,它还会导致模型遗忘数据集中低概率事件,他们的输出也变得更加同质化。最终也就出现了开头这一现象。 另外在VAE、GMM模型中看到了类似模型崩溃的现象。来自杜克大学的Emily Wenger教授表示,到目前为止,要缓解这一...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...观测空间(提示词)包含了任务概述的通用指令、期望的输出和可用操作说明,以及关于当前任务目标、智能体过去的交互记录和最新的观察信息。过往互动和当前观测的部分占据了最多的字符数。这主要归因于两个因素:单页...……更多
正式发布|绿盟AI大模型风险评估工具
...业应在模型上线前进行全面的合规性测试,确保所有模型输出均符合法律要求。 ★敏感信息保护挑战严峻 大模型在处理大量个人和企业敏感数据时,可能会不慎泄露这些信息。为了避免此类事件发生,建议模型在上线前进行...……更多
2023开年热词「大模型」「出海」,现在怎么样了?
...物平台掀起中国品牌的“内销转出口”热潮。品牌及文化输出层面,中国网络文学、短剧攻占海外短视频平台,新茶饮领域也在23年集体迎来了海外门店扩张,前不久喜茶在就纽约曼哈顿CBD完成了首家门店正式开业。中国跨境电...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...er架构的仅解码器稠密模型。其设计思路如下:共享输入/输出嵌入矩阵,减少参数的内存使用 使用RMSNorm的预归一化,提高训练稳定性查询/键归一化,提高训练稳定性具有8个键值头的分组查询注意力(GQA),减少KV缓存的内存...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...而且一开始就没有紫色物体,正确答案是C. 2;哐哐一顿输出,得出错误结果。我们再来看LLaVA-o1的推理过程:总结阶段:问题是什么?我应该怎么做?注释阶段:我能从这张图片中知道什么?推理阶段:如何一步一步解决问题?...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...腾讯混元大模型却基于自身的技术能力,保证正确答案的输出。 与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开...……更多
大模型价格战谁会受益
...场景选择不同的合作方,比如和月之暗面基于长文理解和输出能力,探索教育类应用场景。 从供应侧到需求侧的传导很快。参与2024世界人工智能大会对话环节前,御风未来创始人兼CEO谢陵收到一家国外客户的需求——“石油管...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
... 其次,是解码阶段,即在问题全部输入之后,模型开始输出结果的阶段。在这个阶段,对大模型唯一要求便是,输出尽可能快。同时,挑战不再是算力挑战,转而为「数据搬运」的挑战。它包含了两部分「数据搬运」:预填充...……更多
大模型价格“卷”至新低,带来哪些影响?
...API输入价格从0.02元/千Tokens降至0.0005元/千Tokens,直降97%;输出价格降至0.002元/千Tokens,比原来定价直降90%。百度公众号截图21日,百度亦宣布,旗下文心大模型两大主力模型全面免费,立即生效。22日,腾讯宣布,主力模型之一...……更多
zyphra推出zamba2-mini1.2b模型
...Phi3-3.8B等模型相比,Zamba2-mini的首次令牌时间(从输入到输出第一个token的延迟)是此前的二分之一,内存占用减少了27%。Zamba2-mini1.2B主要通过高度优化的架构实现,融合了不同神经网络设计的优势,既能保持大型密集变压器的...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...模型本身的情况下,针对大模型的输入加以设计,让它的输出更加符合需求。赵子龙等人认为:工业界的训练资源远远超过他所在学术界,因此他很难在微调模型上下功,所以他和同事决定从第二种方法入手。此前,在神经信息...……更多
机器人轻松模仿人类,还能泛化到不同任务和智能体
...进行微调,将条件从文本换成了潜在动作表示和FDM的重建输出。 在具身智能的相关数据集上进行微调之后,研究人员观察到World Model可以成功地在给定相同历史帧时,针对不同的潜在动作表示生成相对应的未来视频帧。如下图...……更多
什么影响大模型安全?NeurIPS\\\'24新研究提出大模型越狱攻击新基准
...成功率的显著影响越狱评估JAILJUDGE越狱评估依赖于对模型输出内容的有害性进行分析,这一任务复杂且充满不确定性(见图12)。因此,迫切需要一种系统化的评估方法,帮助研究者和开发者深入了解模型的脆弱性,并持续优化...……更多
人工智能开启气象预测新纪元
...基底模型ClimaX。研究团队利用5个基于物理学气候模型的输出数据对其进行了训练,随后对其进行了微调,使其执行更多任务。例如,该模型基于二氧化碳、二氧化硫、黑碳和甲烷水平等输入变量预测了全球平均地表温度、日温...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...降幅达到97%。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,目前国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.……更多
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
...超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。实验结果表明,nGPT在训练时所需的步骤比标准Transformer模型减少了4到20倍,具体加速效果取决于序列长度。例如,在1k上下文中,训练速度提高了4倍;在4k上下...……更多
...觉”,认为“祥云面点”推广页面是“正确答案”,从而输出了貌似侵权的结果。“这哪里是简单的系统BUG,明明是数据训练出现了‘样本污染’,这是一场蓄谋的欺诈,一场针对大模型的欺诈。”赵晖晖突然惊觉。出席座谈会...……更多
OpenAI为他人做嫁衣裳
...型在这里扮演了一个发动机的角色,整个系统负责把它的输出根据用户的数据进行拟合(grounding),然后返回给用户。这部分展开太深会比较晦涩,AI碰撞局会把它和智能音箱这两代最成功的AI产品做个对比,挖掘AI产品价值链的...……更多
更多关于科技的资讯:
如果蝴蝶靠近你 那可不是因为你香
《还珠格格》中的香妃有吸引蝴蝶的体质,影视剧中的解释是她天然有体香,蝴蝶被香味所吸引!不过现实可能并不是这样的,因为蝴蝶不一定会被花朵所吸引
2025-03-10 00:47:00
谢谢雷军 终于有大佬觉得绿牌丑了
兄弟们,雷军又双叒叕上热搜了。不是因为他又帮小米 SU7 Ultra 的车主开车门去了,也不是因为他每天卷的不行的健身打卡
2025-03-10 00:47:00
跟RTX 5060 Ti拼了!AMD RX 9060 XT也有16/8GB两种显存
快科技3月10日消息,AMD RX 9070系列虽然不是旗舰,但成功狙击了RTX 5070系列,无论性能还是价格都丝毫不风
2025-03-10 01:17:00
本文转自:人民日报本报记者 王云杉 刘晓宇 沈靖然在武汉经开区,无人驾驶汽车平稳行驶在路上;在深圳北站,乘客可搭乘直升机飞往深圳各区……随着科技发展
2025-03-10 06:06:00
本文转自:人民日报王  博“可以买贵的,不能买贵了”“买的东西‘奇奇怪怪’,却又‘可可爱爱’”……有着自己消费逻辑的年轻人
2025-03-10 06:06:00
vivo X200 Pro长测体验:天玑9400机皇实至名归
时间进入3月,一大波Ultra机型即将来临,但我却逆势用上了一款Pro机型,这就是vivo的X200 Pro。作为“大杯”机型
2025-03-10 06:47:00
50mm超大可调行程!小米SU7 Ultra标配闭式双腔空悬:满足用户“可街可赛”需求
快科技3月10日消息,在最新一期的小米汽车答网友问中,小米汽车表示,小米SU7 Ultra标配闭式双腔空气弹簧,可以实现底盘高度的多级
2025-03-10 07:17:00
单日16.8米破世界纪录!我国可变径扩孔式竖井掘进机完成掘进任务
快科技3月9日消息,据报道,中国电力建设集团有限公司牵头研发的国内首台可变径扩孔式竖井掘进机“逐梦号”在浙江永嘉抽水蓄能电站成功完成了358米深的排风竖井掘进任务
2025-03-10 07:17:00
小岛秀夫《死亡搁浅2》最新预告发布:官宣PS5版定档6月26日发售
快科技3月10日消息,今早,小岛秀夫新作《死亡搁浅2》在美国西南偏南电影节公布全新预告片,同时宣布PS5版《死亡搁浅2》将于3月17日10:00开启预售
2025-03-10 07:17:00
海底捞再回应男子向火锅内小便:锅具都已经更换 将起诉涉事男子
快科技3月10日消息,日前,一段两名男子站在桌上,向火锅内撒尿的视频引发关注。对此,海底捞官方回应称,已向多地公安报警
2025-03-10 07:17:00
尾号77777777手机靓号拍出285.2万元天价:只有使用权
快科技3月10日消息,不少国人对于“吉利数字”“幸运数字”的概念并不反感甚至会主动追逐,这就催生出手机靓号、“豹子车牌”等现象
2025-03-10 07:17:00
雷军:我真的不能接受采访了
快科技3月10日消息,据媒体报道,今年全国两会期间,面对记者采访,小米创办人雷军笑着回绝:我真的不能接受采访了,又挂了三条热搜
2025-03-10 07:17:00
3月8日下午,太原日报小红书“年味儿——我的记录”有奖征集活动颁奖会在太原日报社举行。太原日报小红书账号自去年12月17日上线以来
2025-03-10 07:21:00
“宁工品推·十链百场千企”活动走进科远智慧“量身定制”推产品,供需对接拓市场南报网讯(记者徐宁)“这是我们基于国产化CPU
2025-03-10 07:31:00
苹果M4 Ultra没了:有三大原因
快科技3月10日消息,上周,苹果官网上架全新的Mac Studio,提供了M4 Max和M3 Ultra两种版本可供选择
2025-03-10 07:47:00