• 我的订阅
  • 头条热搜
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
...项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发布之前,团队就开始探索蒙特卡洛树搜索提高大模型数学...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...的前驱是DeepMind的AlphaGo。AlphaGo以前的围棋算法采用的是蒙特卡洛树搜索,试图利用计算机的算力优势进行海量模拟试错,但围棋人工智能也只能战胜业余棋手。AlphaGo的成功取决于开发出了价值网络,将价值网络、策略网络和蒙...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...们在多种搜索算法中进行选择,例如 Beam Search、Best-of-N, 蒙特卡洛树搜索等。每种算法在 PRM 的质量上有其独特的优势。复杂的搜索算法在处理更难的任务时可能表现更好,而简单的方法如最佳 N 则常能在难度较低的情况下表现...……更多
...等信息来训练深度学习模型。研究团队采用了一种被称为蒙特卡洛树搜索的算法,不仅使模型可以预测每个分子的抗菌活性,还能预测分子的哪些化学亚结构可能导致这种活性。为进一步缩小候选药物范围,他们还训练了另外三...……更多
...亚理工学院、华东师范大学合作开发,整合了强化学习和蒙特卡洛树搜索能力。据微软研究团队表示,XOT方法可以让语言模型扩展到不熟悉的问题上,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步...……更多
教人工智能读懂专业文件(新职业新故事)
...智能(AI)模型。杨洪旭供职的达观数据有限公司,位于上海浦东软件园,是一家智能文本处理技术企业。这里研发的AI模型,能读懂合同工单、财务报表、行业报告等各类文本文件,在银行流水识别、合同审核与比对等多场景...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...推理方法解释!解释就解释:本文探讨了 best-of-n 采样和蒙特卡洛树搜索(MCTS)。草莓可能是一种具有特殊tokens(例如回溯、规划等)的混合深度模型。它可能会通过人类数据标注员和来自容易验证领域(如数学/编程)的强化...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...通过扩展数学题库,模拟大量数学题目进行增训,并结合蒙特卡洛树搜索(MCTS)等技术,提升模型解题能力。在逻辑推理方面,腾讯还通过建立问题抽取与评价模型,显著提升了推理能力的广度与质量,最终在多项评测中再创...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语在快速发展的科技领域中,经常出现的模糊用法。值得关注的...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企业落地速度大幅提升,并拥有了全新的中文名“文心快码”,正式加入百度“文心大家族”。据百度首席技术官、深...……更多
常见电子邮件分类算法的性能分析
...第07期.[4]王鹿.基于贝叶斯分类的垃圾邮件过滤技术研究.上海工程技术大学硕士论文,2021年第04期.[5]冯军军,李力.机器学习在垃圾邮件过滤中的实现.电脑知识与技术,2021 ,17 (08).作者简介:樊攀,男,2004年10月生,安徽临泉人,太...……更多
最癫OpenAI爆料者竟是AI智能体??CEO出来认领,网友炸锅
...坦福团队合作的相关研究论文,关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。总之呢,产品和论文看起来还挺正经的。就是CEO声称草莓哥账号是AI控制的这一点,网友们还是不太买账。最近围绕AI的消息太多太乱,大...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...atGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者...……更多
谷歌deepmind公布ai模型训练法
...歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...务上的强大能力。在近日的一项研究中,来自 MIT CSAIL、上海交通大学等机构的研究者进一步探究 LLM 是否可以用来创建多样化的模拟任务,并进一步挖掘它们的能力。具体来讲,研究者提出了一种基于 LLM 的框架 GenSim,它为设计...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...争力。 庞若鸣是普林斯顿计算机博士,本硕分别毕业于上海交大和南加州大学,于2021年加入苹果,此前在谷歌担任了15年的工程师。Apple Intelligence的主要对话功能,正是由他率领的团队研发的模型提供支持。这次他还强调,这...……更多
... 为粮食安全提供科技支撑俞陶然本报讯(记者 俞陶然)上海人工智能实验室昨天联合崖州湾国家实验室和中国农业大学,发布了我国首个种业大语言模型“丰登”(SeedLLM)。在上海人工智能实验室研发的大语言模型“书生·浦...……更多
传openai全球招外包大军手把手训练chatgpt取代码农
...Pitchfork,也还在酝酿中;而微软的GitHubCopilot主要是一个代码补全工具。要说完全代替人类码农,它们还不够格。但如果真的让ChatGPT学会了用人类思维去编程,这些友商/自家的产品恐怕要被吊打。而从种种迹象看来,OpenAI似乎正...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...大于App Store,前者更多的是赋能,后者更多的是适配。”上海市数据科学重点实验室主任、复旦大学教授肖仰华对澎湃科技表示。OpenAI认为,GPT平台最终将使其更接近终极目标:创建AI超级智能或通用人工智能(AGI)。就目前而...……更多
中文无代码编程工具:让每人拥有一群智能数字机器人
...能数字机器人,进而推进这场人机交互的变革。 顺应无代码趋势在体验朗思Agent智能工具过程中,我们注意到,这款具备中文无代码开发特性的智能工具不仅能帮助使用者在企业办公中完成跨平台、跨系统业务协同操作、数据...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...数据。而最近一个多月,混元大模型能力提升比较大的在代码能力以及数据推理,效果较此前有20%的提升。并且,对话上下文窗口,也从原来的4K,中小模型可以长至16K。而第三季度,可以说是国内大模型领域的关键节点——包...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整个机器学习研究的全过程。更让人难以置信的是,从构思到成文,一篇论文的成本仅需15美金(107.61元)。「AI科学家」是...……更多
百度文心大模型4.0技术进展
...也达到了理解的2倍多。百度基于文心大模型研制了智能代码助手Comate,从内部应用效果来看,整体的代码采纳率达到40%,高频用户的代码采纳率达到60%。据悉,文心大模型4.0在9月已开始小流量上线,过去一个多月效果又提升了...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...ixtral-8x22B等相比,在多学科综合评测集、中英文NLP任务、代码、数学等9大维度,混元Large实现全面领先。混元Large包含高质量合成数据、专家特定的学习率缩放、KV缓存压缩、长上下文处理能力、广泛的基础测试等主要技术创新...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...就显得极为突出。最近,浙江大学、中科院软件研究所、上海科技大学等机构就联合提出了一种新的多模态基准,专门衡量模型对抽象图像的理解能力和视觉推理能力。论文地址:https://arxiv.org/pdf/2407.07053数据集共包含11,193个带...……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...问答场景已提供超过200万次问答服务;辅助编码场景支持代码生成、单测生成、代码翻译等功能,已超过8万行代码投入生产应用。四、社会评价中国农业银行人工智能研发团队秉持创新发展理念,主动拥抱AI大模型前沿技术,以...……更多
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...迭代分析的过程:然后Genie就开始“唰唰唰”地自动写+跑代码了: 如果运行代码过程中出现bug,Genie会只针对出问题的地方再重复分析、写代码和运行的过程,直至跑通为止。而整个过程,仅仅耗时84秒!用团队的话来说: Geni...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...关键创新:重复感知采样(repetition aware sampling)和分组代码建模(grouped code modeling)。重复感知采样是对VALL-E中随机采样的改进,能够自适应地采用随机采样或者核采样(nucleus sampling),选择的依据是曾经的token重复,因此……更多
商汤科技sensetime推出“云端边”全栈大模型体系
2024年4月23日,上海——商汤科技SenseTime举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova5.0”大模型体系,其综合能力全面对标GPT-4Turbo,...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...iniCPM-Llama3-V的分词器,后来证据越来越多——不仅架构和代码高度相似,而且被发现作者曾在Hugging Face导入MiniCPM-V的代码,然后改名成Llama3-V。最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能识别清华战国竹简...……更多
更多关于科技的资讯:
目前,安装ETC的车主越来越多,使用ETC通行高速,也成为越来越多现代车主出行的便捷选择。然而,在使用过程中,有时可能会遇到一些问题
2024-12-22 17:48:00
新时代的奔腾!Intel Wildcat Lake首次曝光:可能18A工艺
快科技12月22日消息,我们第一次看到了Intel一款新处理器的名字“Wildcat Lake”(野猫湖),目前看定位于入门级
2024-12-22 18:33:00
酷睿Ultra 200 65W包装盒首曝:没有无核显285F、没有3系列
快科技12月22日消息,Arrow Lake桌面版酷睿Ultra 200系列目前发布的只有K/KF系列,65W主流版本和35W节能版本将在明年初发布
2024-12-22 18:33:00
男孩在澳大利亚海滩发现奇怪生物 专家警告:恐有剧毒
快科技12月22日消息,据报道,一名男孩在澳大利亚巴特曼斯湾海滩惊现形似“外星生物”的物种。据悉,这种生物呈现出独特的蓝色管状形态
2024-12-22 18:33:00
最高时速250km/h!广汽集团发布GOVY AirJet飞行汽车官宣:2025年开启预订
快科技12月22日消息,广汽集团近日详细介绍了其全新飞行汽车品牌GOVY高域及首款复合翼飞行汽车GOVY AirJet
2024-12-22 18:33:00
CPU-Z小升级:支持Intel四大新品、新内存
CPU-Z近日迎来了一个小幅升级版本,v2.13,但内容相当丰富,重点支持Intel四大新品。首先是显卡方面,正式支持新发布的锐炫B580
2024-12-22 19:03:00
上海地铁11号线预计今晚9时恢复运营
本文转自:人民日报客户端据@上海地铁shmetro ,经全力抢修,11号线受损区段预计今晚9时左右恢复开通运营。
2024-12-22 19:07:00
石头居然长出了\
在秋天的阿拉斯加冰川湾公园,人们发现,石头居然长出了头发。看起来还挺浓密的。|atlasobscura而在墨西哥的查帕拉湖
2024-12-22 19:33:00
机械师K600G键盘首发299元:弹床式Gasket结构、定制HIFI轴
快科技12月22日消息,机械师K600G机械键盘目前已经上市,首发299元。据悉,该款键盘采用弹床式Gasket结构设计+多层复合降噪填充
2024-12-22 19:33:00
AMD显卡又双叒叕改名了!下代可能叫RX 9070
快科技12月22日消息,按照惯例延续下来,AMD RDNA4架构的下一代显卡应该是RX 8000系列,预计有RX 8800
2024-12-22 19:33:00
鲁网12月22日讯(记者 孙强 通讯员 冷梅)为学习日本知名企业管理经验,积极助力民营企业经营管理现代化、国际化,增强企业创新发展源动力
2024-12-22 19:57:00
印尼女子海边洗脚 突遭4米长鳄鱼死亡翻滚:逃生可能为0
12月16日,印尼北苏门答腊省南尼亚斯县,一名女子在海边洗脚时,遭遇了一条3.94米长的大鳄鱼袭击。附近居民听到了女子惨叫
2024-12-22 20:03:00
江南时报讯 域名作为企业的网络身份标识,停用后若不及时注销,不仅可能导致品牌方形象受损,还可能被一些境外服务器的不良网站抢注并用于播放侵犯他人著作权的影视作品
2024-12-22 20:52:00
9岁女孩长期吃头发胃里取出大块头发团:胃酸无法分解
快科技12月22日消息,据报道,南宁市妇幼保健院为9岁女孩小琪进行了开腹手术,从她胃里取出直径约4厘米的头发团,以及小肠内条索状头发丝绳约30厘米长
2024-12-22 21:03:00
江南时报讯 泰州某知名医药公司与某文化公司签订冠名合作协议,约定冠名费50万元,文化公司承诺3个月内完成500万元直播带货销售额
2024-12-22 21:25:00