• 我的订阅
  • 头条热搜
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
...横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多
高通骁龙x系列的实力到底如何?
...快速演进,并将直接在终端设备上运行,从智能手机,到下一代PC,最终进入汽车等更多终端。”没错,高通的骁龙X系列,正是“生成式AI直接在终端设备上运行”的核心硬件平台之一。去年10月,高通在骁龙峰会上推出了骁龙XE...……更多
马斯克的AI大模型登场
...够运行该模型,意味着特斯拉可能拥有地球上最大数量的推理算力。即便未来无人驾驶出租车的愿景成真,汽车每周的实际使用时间大致只有三分之一,剩下三分之二的时间可以用来做分布式推理,例如参与“寻找地外文明计划...……更多
ai终端产业创新论坛在沪举行
...,十分期待骁龙XElite平台能够助力联想等行业领导企业为下一代AIPC带来智能化和个性化的创新体验”。 “要训练好一个大模型,就是让他从小学生开始,读到中学生、大学生再到博士。”百川智能联合创始人、联席总裁洪涛介...……更多
开源大模型新的里程碑!Llama 3.1 模型准时发布
...到了128K,支持多语言,代码生成性能优秀,具有复杂的推理能力;2.从基准测试结果来看,Llama3.1超过了GPT-40125,与GPT-4o、Claude3.5互有胜负;3.提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式...……更多
昆仑万维董事长方汉谈“开源模型落后”:和闭源的差距在缩小,不存在谁压倒谁
...资源,这在中国是位于前列的。我认为万卡资源足够支持下一代多模态大模型的训练。长期来看,如果遇到算力受限的情况,就要求你去优化推理和训练的算法。媒体:“天工”模型都是开源的,对于“开源模型会越来越落后”...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...产品的研发。因此,FAIR现在被重新定位为开发更长期的下一代人工智能系统。我们基本上不再专注于语言模型。人工智能的成功,包括语言模型和其他许多系统,在过去五六年里,主要依赖于自监督学习技术。自监督学习的一...……更多
专访微软AI CEO:没有 OpenAI,我们也能训练出世界上最好的模型
...希望这种合作能长期持续下去。 NP:所以,你们不会在下一代模型进入竞争,对吗?你们依然打算让 OpenAI 来做这件事。我之所以这么问,是因为微软运营着数据中心,对吗?这种合作关系一直在持续,但亚马逊和谷歌都运营着...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
...考”即可体验。API接口和使用方式保持不变。“如非复杂推理任务,建议使用新版本V3模型,即刻享受速度更加流畅、效果全面提升的对话体验。”新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推...……更多
科大讯飞:在智能汽车领域将持续融合集成行业最新相关技术
...信息的真实性与可靠性。投资者:你好,请问公司的深度推理X1什么时候能升级一个版本,支持所有问题的推理,而不仅仅是数学题。科大讯飞董秘:您好,2025年1月15日,科大讯飞首发国内首个基于全国产算力平台训练的具备深...……更多
Google 创始人谢尔盖·布林回归,直面 Gemini、Google、AGI 若干问题
...们不会提高价格,有两个主要的原因。首先,我们在模型推理方面一直在进行优化,每个月都有新的想法和优化方法累积起来,比如有 10% 的改进,有 20% 的改进,这样积累起来就可以产生显著的效果。其次,我认为我们的TPU在...……更多
微信灰度测试接入DeepSeek:多产品探索接入,可免费使用R1满血版
...eepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。春节假期后,国内多个行业龙头公司均宣布接入DeepSeek。2月...……更多
...赖算力资源的预训练阶段竞争终结了,下一阶段的重点在推理,并将出现一批新公司,DeepSeek的出现也是必然,用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快,但我们并没有投资大模型项目...……更多
...以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。据了解,s1模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。李飞飞团队研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Fl...……更多
全新开源王者!NVIDIA悄然推出70B AI模型:力压GPT-4o、仅次于OpenAI o1
...,Nemotron-70B基于Llama-3.1-70B开发,在没有专门提示和额外推理token的情况下,Nemotron-70B也能答对复杂的推理问题,如“草莓有几个r”的经典难题。业内人士评价,NVIDIA在Llama 3.1基础上训练出的这个不太大模型,能够超越GPT-4o和Claud.……更多
不听人类指挥 OpenAI模型拒绝关闭
...,但o3篡改计算机代码以避免自动关闭。o3模型是OpenAI“推理模型”系列的最新版本,旨在为ChatGPT提供更强大的问题解决能力。OpenAI曾称o3为“迄今最聪明、最高能”的模型。美国AI安全机构帕利塞德研究所说,o3破坏关闭机制以...……更多
深入芯片底层定义,findx8系列实现能效巨大突破
2024年10月9日,深圳——OPPO今日宣布,下一代旗舰FindX8系列将首发搭载全新一代OPPO潮汐引擎与MediaTek天玑9400旗舰芯片的最强性能能效技术组合,并将于10月24日正式发布。通过OPPO与MediaTek深入芯片底层共同开发天玑9400,搭载潮汐...……更多
老是出错的AI搜索 要被夸克整顿了
...不是爱胡乱脑补嘛,那就直接换成聪明的,现在最先进的推理模型,这就能在一定程度上解决问题。但要用在 AI 搜索上,如果只靠外挂 DeepSeek,那其实也不好说就能做到深度融合,发挥出推理模型的优势。 要想最大化推理大模...……更多
近日,我国“深度求索”公司发布的具备深度思考和推理能力的开源大模型 DeepSeek-R1 受到了全世界的关注。在 DeepSeek-R1 之前,美国 OpenAI 公司的 GPT-o1,Athropic 公司的 Claude,Google 公司的 Gemini,都号称具备了深度思考和推理能力..……更多
不要小看「实而不华」的腾讯 AI
...已追平 GPT-4,在处理「时新」问题的表现上,包括数学、推理等方面的能力也有显著提升。多种尺寸的腾讯混元 MoE 模型也即将对外开源,可适用于手机端、PC 端、云/数据中心等不同的部署场景。在多模态方面,腾讯也有了较多...……更多
黄仁勋:市场对DeepSeek的理解完全错误,算力需求依...
...勋宣布基于Blackwell架构的最新芯片Blackwell Ultra(GB300)和下一代Rubin架构将如期推出,再下一代芯片被命名为“Feynman”。黄仁勋解释道,英伟达选择向全世界公布未来三四年的路线图,是为了让合作伙伴都可以参与进来,“这样...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...像描述性能。实验结果表明,PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色;用户偏好研究表明,PGv3模型在常见的设计应用中,如表情包(stickers)、海报和logo设计,具有超越人类的图形设计能力,还能够精确...……更多
摩尔线程、360达成战略合作!打造360智脑国产算力底座
...成国产、自主、可控的360智脑大模型,具备大模型管理、推理部署等功能。摩尔线程全功能GPU将为该一体机提供强大的底层算力,以高性价比硬件方案确保大模型推理效率与成本的平衡。不仅如此,360大模型产品还与摩尔线程完...……更多
...文本、图像、视频、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。谷歌公司称,“双子座”将推出三种版本:Ultra版本功能最强大,适用于高度复杂的任务,预计2024年...……更多
国内首家!QQ音乐宣布集成满血版DeepSeek-R1
...解,今年1月20日,中国AI初创公司深度求索发布DeepSeek-R1推理模型, DeepSeek称其在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。为进一步促进技术的开源和共享, DeepSeek支持用户进行“模型蒸馏”,在用户协议...……更多
全球权威评测榜单BIRD:蚂蚁数科超越谷歌等公司位居第一
...(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视...……更多
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
...也超过了Claude 3 Opus。在诸如解释图表、图片等处理视觉推理的任务中,3.5 Sonnet可以准确地从不完美的图像中转录文本,对于零售、物流和金融服务等领域的客户来说尤为重要。3.5 Sonnet还可以用于自动化视觉数据处理任务,增强...……更多
AI落地千行百业,存储痛点凸显,浪潮信息如何助力AI向实?
...,浪潮信息的存储解决方案已经在互联网企业大模型训练推理场景、大型AI算力中心与某国家重点实验室中落地。例如,在大模型场景训练中,浪潮信息通过增加全闪存储帮助客户实现效率提升,将断电续训时间降低到分钟级别...……更多
更多关于科技的资讯:
新闻纵深|“十四五 ”微记忆③:“丝网二代”的智造突围
阅读提示数智浪潮,奔涌而至。过去五年,人工智能等前沿科技,以不可逆转之势重塑千行百业。在安平,年轻的“丝网二代”逯千里
2025-12-17 08:09:00
国潮服饰消费热度 仍在上升
近期,在多地举行的时装周秀场上,马面裙等国潮服饰一经亮相就成为全场焦点;森马等传统服装品牌于近期宣布将推出国潮系列产品
2025-12-17 07:18:00
12月11日,我国自主研发的高空长航时多用途重型“九天苍穹”无人航空通用平台在陕西圆满完成首飞任务。这款性能位居全球前列的大型通用无人机横空出世
2025-12-17 07:35:00
记者走基层|手机没电没网 也能“硬核”付款
12月9日,雄安新区商务服务中心雄礼记商店内,市民孟令双(左)在手机关机的情况下,通过“碰一碰”完成购物付款。河北日报见习记者 康晓博摄“嘀”一声
2025-12-17 08:03:00
“2025年度十大新词语”16日发布,依次为:苏超、票根经济、杭州六小龙、现代化人民城市、育儿补贴、跨境支付通、对等关税
2025-12-16 14:07:00
中国联通三明分公司全力护航“音综王牌超级LIVE演唱会”通信网络畅通
开展专项通信保障工作东南网12月16日讯(通讯员 肖锦雯)密集的人流举起手机,试图捕捉舞台上的精彩瞬间,一场关于信号流畅度的保障已在观众看不见的地方悄然完成
2025-12-16 14:19:00
在国家大力推进现代化产业体系建设的宏伟蓝图下,科技创新与数字经济已成为驱动高质量发展的“双轮”。中国人寿财险江西省分公司主动融入时代潮流
2025-12-16 14:58:00
京东与国际铂金协会达成战略合作 成为其首个线上零售合作伙伴
近日,京东与国际铂金协会(PGI®)达成战略合作,成为其首个线上零售合作伙伴,双方将共同推动铂金首饰的线上消费体验升级
2025-12-16 15:17:00
服务“2030愿景”:中国AI营销平台王牌狮助推中沙数字经济务实合作
2025年12月11日,王牌狮团队在北京迎来沙特阿拉伯投资考察团,并进行了战略与技术交流。此次沙特投资考察团之行,重点关注以王牌狮AI营销智能体及建筑业垂直大模型阿拉丁ALDGPT为代表的中国数智化解决方案
2025-12-16 15:22:00
【宅男财经|专家面对面】对于近期AI换脸被滥用的问题,工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 18:16:00
济南市商务局携手阿里高德推“烟火济南支持计划”: 免商家开店费+精准流量扶持
鲁网12月16日讯12月16日,在高德扫街榜“烟火城市系列发布会·烟火济南”活动现场,济南市商务局、济南市工商联餐饮协会
2025-12-16 20:53:00
【宅男财经|专家面对面】泡泡玛特在国外广受欢迎,针对中国是否还会出现下一个LABUBU,中国广告协会会长、国际广告协会全球副主席张国华在接受宅男财经采访时表示
2025-12-16 21:57:00
雪博会最强指南!6.5折薅遍全球冰雪好物
12月18日至22日,第九届吉林雪博会将在长春东北亚国际博览中心举办,想一站式囤齐冰雪装备、淘遍特色好物?这份购物攻略请收好
2025-12-16 22:24:00
过去,客户经理找客户,靠的是跑园区、混商圈的经验和熟人脉;今天,打开“数智江南”App,就像打开了小微企业导航地图。这小小的转变
2025-12-17 00:05:00
江南时报讯 今年以来,泗阳农商银行坚持以客户为中心,将财富管理作为零售升级的重要方向,着力打造专业、规范、有温度的财富管理服务体系
2025-12-17 00:10:00