• 我的订阅
  • 头条热搜
加速替代CUDA!摩尔线程开源vLLM-MUSA 加速国产GPU AI
...科技11月5日消息,近日,摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示,正努力围绕自主研发的统一系统架构GPU、MUSA软件...……更多
...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后,LLM审查MCTS的思想并识别任何错误,然后进行额外的MCTS模拟以生成修改后的想法。最后,将修改后...……更多
大模型“翻车”小学题?
...相关性,使得AI在文字创作上达到人类平均水平,而数学推理更需要的是因果性,数学是高度抽象和逻辑驱动的,与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学,除了学习世界知识外,还应该有思维...……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...会出现一些意想不到的复杂能力,譬如类似人类的思维和推理能力。正如前面所提到的,紫东.太初2.0首次提出了全模态多任务统一生成式学习框架,即全模态分组对齐、分组解码和联合解码的学习方式,形成了全模态逻辑推理...……更多
2023IDEA大会:让大模型更好应对复杂问题
...本正经的胡说八道”怎么解?众所周之,大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性,这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷,是当下AI应用的重要课题。为此,IDEA...……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
...语言模型之外的其他技术。例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神...……更多
百度文心一言发布会详细纪要
...话体现出文心一言各方面的能力,比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,出错的概率还是挺高的,这些问题都答对相当不容易,因为百度的...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
...,目前已初具“近似人类”的自我认知、情感体验、思维推理能力,能够“听”懂人类语言、“理解”人的情绪和意图,并能较为逼真地呈现出来。基于此,随着脑机接口技术的发展,Sora或可成为连接人脑与人脑、人脑与机脑...……更多
谷歌王者归来?最新推出的大模型到底有多强,能否挑战GPT-4
...问题,这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源:官方视频谷歌还发布了一个时长六分钟的视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言...……更多
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、营销战硝烟燃起,融资热度正在降温。不过...……更多
openai发布多语言大规模多任务语言理解
...语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。MMMLU的创建反映了OpenAI对测量模型实际能力的关注,尤其是在NLP研究中代表性不足的语言,纳入多种语言可确保模型在使用英...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
产品周报242期 | 微信小程序能用支付宝数币钱包了,OpenAI推出新一代大型语言模型GPT-4
...OpenAI,已推出了新一代的自然语言处理模型GPT-4,在高级推理能力上胜过去年11月份推出、用户已经过亿的ChatGPT。一、值得关注中央网信办开展“清朗·从严整治‘自媒体’乱象”专项行动3月10日下午,中央网信办组织召开全国...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...够在多模态大模型(如 LLaVA)的训练中显著提升复杂视觉推理的表现。代码与模型均已公开,欢迎访问 https://aka.ms/llm2clip 了解详情和试用。LLM2CLIP 目前已被 NeurIPS 2024 Workshop: Self-Supervised Learning - Theory and Practice 接收……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...方法直接教授模型安全规范,并训练它们在生成响应之前推理这些准则进,将安全原则融入推理过程中。 整个过程分为两个阶段,第一阶段,监督微调(SFT)训练模型参考并推理安全规范,使用从基础模型生成的数据集。第二...……更多
...在Github、Hugging Face等平台开放。开源代码涵盖模型训练和推理代码,开源数据包括超100万条对话训练数据,开源模型包括160亿参数中英双语基座语言模型、对话模型及插件增强的对话模型。复旦大学计算机科学技术学院教授、MOS...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...侧大模型加速部署,或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手, \"AI科学家\"有望加速问世。这三个报告,一方面预测了AI Agent的未来发展趋势,另一方面也同时提及了多模态大...……更多
字节跳动清华AIR成立联合研究中心 推动大模型产学研合作
...不论是进一步推动当前范式下的Scaling Law,还是模型逻辑推理能力的强化,或是模型学习、记忆能力的进一步提高,仍然有非常多的工作亟待我们去深入研究。希望双方能充分发挥各自优势,在同样梦想的引领下,一起努力做有...……更多
chatgpt低成本复现流程来了
...。相比原生PyTorch,单机训练速度最高可提升 7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量 3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
微软发布旗下最小语言模型phi-2
...写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。微软现在更新发布的Phi-2拥有27亿参数,规模虽然比此前版本翻番,但相比较其它主流语言模型,...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...:完全是胡说八道。最新的公开演讲中,他表示,系统要推理、规划和理解物理世界,至少还需要几年甚至十年的时间,这时候人工智能才能达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练...……更多
更多关于科技的资讯:
2024获奖最多游戏排行榜出炉!《黑神话:悟空》仅排第五
快科技1月12日消息,2024年,哪款游戏才是真正的年度最佳游戏?每个人心中或许有不同的答案,各个平台机构的评选结果也都不同
2025-01-12 22:22:00
9800X3D溢价仍抢手至极!德国MindFactory每两分钟半就卖一颗
快科技1月12日消息,根据德国零售商MindFactory公布的数据,AMD锐龙7 9800X3D处理器的销量已从1月1日的8700颗增长到了1月11日早的14160颗
2025-01-12 22:52:00
GT 1030变RTX 5090!LSFG 3正式发布:解锁20倍帧生成
快科技1月12日消息,第三方付费工具Lossless Scaling Frame Generation(LSFG)发布了其3
2025-01-12 23:22:00
机械革命无界14N笔记本首销5999元:酷睿Ultra 5-228V
快科技1月12日消息,机械革命无界14N笔记本目前已经上架,首发5999元。据悉,机械革命无界14N采用英特尔酷睿Ultra 5-228V处理器
2025-01-13 00:22:00
海拔3500米起飞!我国首次在昆仑山完成无人机增雪作业实验
快科技1月13日消息,据报道,一架配备云降水探测与人工影响天气作业装备的中型无人机近日从昆仑山麓起飞,并成功实施人工增雪作业
2025-01-13 00:52:00
预审导航联动助力海上火箭发射技术专利布局
胶东在线1月8日讯(通讯员 刘伟)随着商业航天作为新质生产力代表写入政府工作报告,商业航天进入发展快车道。由鲁东大学牵头建设的山东省海上航天装备技术创新中心紧紧围绕我国经济与社会发展对海上火箭发射技术的战略需求
2025-01-13 03:03:00
本文转自:人民日报海外版中国科创闪耀美国“CES创新奖”——访美国消费者技术协会首席执行官夏皮罗《人民日报海外版》(2025年01月13日第 09 版)2025年美国拉斯维加斯消费电子展(CES)近日开幕
2025-01-13 04:41:00
本文转自:人民日报全国数据工作会议提出深入实施数字化转型工程《人民日报》(2025年01月13日第 02 版)本报北京1月12日电 (记者王云杉)记者从近日召开的全国数据工作会议获悉
2025-01-13 06:02:00
本文转自:人民日报《人民日报》(2025年01月13日第 14 版)本报北京1月12日电 (喻思南、高鸽)国产化“中农科·龙腾”饲料配方工业软件近日在北京发布
2025-01-13 06:05:00
本文转自:人民日报《人民日报》(2025年01月13日第 06 版)本报北京1月12日电 (记者李建广)近日,记者从京津冀产业协同暨先进制造业集群发展新闻发布会上获悉
2025-01-13 06:07:00
本文转自:人民日报北  湖展望未来,以科技创新引领新质生产力发展,建设现代化产业体系,我们有底气、有信心回望刚刚过去的2024年
2025-01-13 06:18:00
抖音粉丝破千万!周鸿祎准备送车:考虑仰望U8、享界S9、问界M9
快科技1月13日消息,日前,360集团创始人周鸿祎发布视频称,给粉丝送汽车的活动马上就要开始了。周鸿祎表示:“黄子韬前几天送车的活动已经做完了
2025-01-13 06:52:00
河南王守义十三香40周年厂庆:价值600多万华为手机送员工 每人一部
快科技1月13日消息,据媒体报道,近日河南驻马店王守义十三香迎来40周年厂庆,董事长花600多万给1000多名员工每人发一部华为Mate 60手机
2025-01-13 07:22:00
除夕车票明天开售!铁路12306提醒春运购票最最最重要的三件事
快科技1月13日消息,按照2025年春运购票日历,今天将开售除夕前一天(1月27日工作日)火车票,1月14日将开售除夕当天的火车票
2025-01-13 07:22:00
一年一度的科技盛会,CES2025堪称科技潮流“风向标”,全球顶尖科技企业汇聚于此,展示前沿、创新性的产品与技术,引领未来科技发展的走向
2025-01-13 07:46:00