• 我的订阅
  • 头条热搜
高能技巧!60 行 NumPy 代码 从头实现一个 GPT
...,一名工程师 Jay Mody 在一篇文章汇总将用 60 行 NumPy 代码从头实现一个 GPT。并把 GPT-2 模型权重加载到实现中,从而生成文本。原文链接:https://jaykmody.com/blog/gpt-from-scratch/作者 |Jay Mody译者| 禾木木出品 ……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...调试器和性能分析工具组成的工具链,,帮助开发者优化代码简而言之,CUDA使GPU加速LLM训练变为现实,大幅缩短了训练时间。100%的Triton内核Pytorch最近发表了一篇技术博客,他们以两个模型——Llama3-8B和IBM的Granite-8B Code为例,100...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...了自动提示词工程的概念、原理和工作流程,并通过代码从头实现了这一方法。自动提示词工程是什么?自动提示词工程(APE)是指自动生成和优化 LLM 提示词的技术,目标是提升模型在特定任务上的性能。其基于提示词工程的...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的Agent能力,使得「天...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...atGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta、DeepMind和谷歌等为核心,发了不少达到SOTA的模型。这不,立刻有学者...……更多
史上最快AI芯片「Sohu」,速度10倍于B200,哈佛辍学生打造
... GPU 和 TPU 上,软件是一场噩梦。处理任意 CUDA 和 PyTorch 代码需要极其复杂的编译器。第三方 AI 芯片(如 AMD、Intel、AWS 等)在软件上总共花费了数十亿美元,但收效甚微。而 Sohu 只运行 transformer,因此只需要为 transformer 编写……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...窗口达200K左右。本次更新主要增强知识、数学、推理及代码能力,全面对标GPT-4 Turbo。在文科能力方面,“日日新5.0”的创意写作能力、推理能力及总结能力均有提升,相同的中文知识注入后,可获得更好的理解总结及问答,为...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...的潜力,提出新的高效微调方法LoRA-Dash。来看具体内容。从头搭建特定任务方向的框架随着大型语言模型的发展,针对特定任务微调模型往往需要大量计算资源。为了解决这一问题,参数高效微调(PEFT)策略应运而生,像LoRA等...……更多
被AI冲击的游戏公司,会上演“集体失业”吗?
...正向辅助,比如说我平常写代码,以前可能写一个算法得从头想或者找别人写过的代码来改,现在可以直接问GPT,它会给你写一版,我不会直接用,会先看看写的对不对,然后去试用,大多数时间它会出错,但你可以让它纠错。...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...十亿个值,从而尽可能减少存储参数所需的空间。让我们从头开始,探索数值是如何表示的,然后再进行优化。如何表示数值数值存储的形式通常是浮点数(floting point number,或简称为floats):一个带有小数点的正数或负数。这...……更多
...数据分析应用奇智明数ChatBI:在训练过程中加入了大量SQL代码数据,所以其专通SQL生成能力,并通过交互问答的方式实现交互式可视化报表生成和数据分析,在不同业务场景如生产线分析、数据抽取等方面均可灵活响应业务需求...……更多
...已支持一半以上蚂蚁工程师的日常开发工作,他们提交的代码中10%由AI生成。 ……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...个深度学习堆栈,并与微软Azure云平台一起为其工作负载从头开始共同设计了一台超级计算机。一年前,OpenAI训练GPT-3.5作为系统的第一次“试运行”,发现并修复了一些错误并改进了其理论基础。结果GPT-4训练运行前所未有地稳...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关的研究每天都有,但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba(进化到了1.5版本,最...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...200K左右。本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4Turbo,主流客观评测上达到或超越GPT-4Turbo。在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注...……更多
告别搜索引擎!讯飞星火认知大模型评测:改变人机交互方式 还能帮你写代码!
...件测试、软件开发、零基础编程学习等,甚至还能将Python代码转换为Java代码,跨语种编程的实用性,只有程序员才能领略得到。我们也对大模型的代码解释与编写能力做了测试。(1)Python代码解释例如,在Python代码解释小助手...……更多
旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
...的开源数据集,配合开源代码,使得感兴趣的从业者可以从头开始完整复现这些令人惊艳的效果。为了完全复刻原始视频的表情和动作,MegActor 采用了原始图像进行驱动,这与多数厂商使用 sketch、pose、landmark 的中间表示皆然不...……更多
工程师解读GPT-4:基于草图10秒内生成代码令人惊艳,或将优先挑战AI行业从业者
...的指令。“最惊艳的是它通过一张网页草图在10秒内生成代码”与此前的GPT系列模型相比,GPT-4最大的突破之一是在文本之外还能够处理图像内容。OpenAI表示,用户同时输入文本和图像的情况下,它能够生成自然语言和代码等文...……更多
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
...文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌...……更多
GPU训Llama 3.1疯狂崩溃,竟有大厂用CPU服务器跑千亿参数大模型?
...源2.0」在通用服务器上跑起来了!面对用Java编写程序的代码任务,「源2.0」非常迅速地给出了结果。再给它上一道推理题——船边挂着软梯,离海面2米,海水每小时涨半米,几小时海水能淹没软梯? 同样,AI几乎0延迟给出了...……更多
chatgpt的“越狱”技巧:用死亡威胁使其回答违禁问题
...人工智能可以回答各种问题,无论是历史事实还是计算机代码,令人们眼花缭乱,并引发了一波人工智能投资潮。现在,有用户似乎找到了利用ChatGPT黑暗一面的方法,通过强制手段迫使其违反自己的规则,回答一些违禁问题。Ch...……更多
腾讯混元大模型批量上新:10秒生成AI图像,超过180个腾讯业务接入 | 最前线
...数据。而最近一个多月,混元大模型能力提升比较大的在代码能力以及数据推理,效果较此前有20%的提升。并且,对话上下文窗口,也从原来的4K,中小模型可以长至16K。而第三季度,可以说是国内大模型领域的关键节点——包...……更多
探秘IOT领域中神奇的“状态机”
...性,以避免重复编写相似的状态机模型,提高开发效率和代码质量。具有较好的可维护性和可扩展性,以方便后期的升级和维护。安全需求能够保护IOT设备的数据安全和隐私安全,避免因状态机模型漏洞而导致的数据泄露和攻击...……更多
上交大推出“可进化游戏引擎”!虚拟世界演化无需预设
...引擎结合,能够被被特定的条件触发,自动地成长出新的代码。选择宝可梦题材做实验,是因为团队中大部分成员都是宝可梦粉丝,目前相关论文已上传ArXiv平台。「失控玩家」走进现实研究团队用电影《失控玩家》中的主人公 ...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...U和还是TPU上,软件都是一场噩梦。处理任意的CUDA和PyTorch代码,需要的编译器极其复杂。为此,AMD、英特尔、AWS这些第三方AI芯片,都在软件上投入了数十亿,但效果依然不佳。这里,Sohu的好处就体现出来了——因为它只运行Tra...……更多
...确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出...……更多
1890美元,就能从头训练一个还不错的12亿参数扩散模型
...。现阶段,视觉生成模型擅长创建逼真的视觉内容,然而从头开始训练这些模型的成本和工作量仍然很高。比如 Stable Diffusion 2.1 花费了 200000 个 A100 GPU 小时。即使研究者使用最先进的方法,也需要在 8×H100 GPU 上训练一个多月的...……更多
ChatGPT强敌Claude发布全新版本:免费,记性还更好 | 最前线
...Anthropic与Claude 1.3一样,Claude 2可以实现文档搜索、总结,代码分析和编码等功能。根据官网给出的示例,用户只需上传需要分析的文档,然后给出相应的指令,Claude就会自动阅读文档,并作出回答。示例中的两个pdf大小总计近300...……更多
OpenAI“断供”,谁才是最大赢家
...DiT模型已部署到Hugging Face官方模型库Diffusers中,仅用三行代码即可调用,无须下载原始代码库,大大降低了使用门槛。开源仅一个月,腾讯混元在开源社区Github Star数(关注数)达到2400个,高居社区热门DiT模型前列。如腾讯公司...……更多
进迭时空宣布开源RISC-V芯片的AI核心技术
...研RISC-VAICPU上的核心技术,包括AI扩展指令和全部AI软件栈代码,助力RISC-V生态建设。为了RISC-V开发者们便捷使用这些AI代码,进迭时空正在做代码整理,预计最晚将在今年Q4季度开源所有AI软件栈代码。“我们将开源我们在AI上的...……更多
更多关于科技的资讯:
差评不断,iPhone16系列口碑、销量下滑,苹果为什么掉队
过去这些年,苹果每次发新机都引发粉丝大排长龙抢购,黄牛加价倒卖几乎成为常态,甚至开售一两个月基本供不应求。今年却发生改变
2024-09-20 14:05:00
Z世代空调以旧换新,新风增氧除醛已成必选项
新消费市场下,年轻一代作为数字时代不可或缺的消费引擎,对品牌提出了更高的需求挑战,空调行业亦然。Z世代都怎么选空调?一项调研数据显示
2024-09-20 14:07:00
苹果不愧是牙膏大厂!iPhone16Pro首批体验出炉
随着iPhone16系列即将在9月20日正式上市,抢到首批货源的在当天就能收到新机。与此同时,iPhone16系列的首批评测和使用体验已经解禁
2024-09-20 14:08:00
坐二冲一!小米超越苹果,拿下全球第二
9月18日,知名市场调查机构CounterpointResearch发布了一组数据,在今年8月份,小米智能手机在全球范围内的销量超越苹果
2024-09-20 14:08:00
最强小屏标准版!高管晒vivo X200惊艳拍照
vivo此前已经宣布,将在10月14日发布年度旗舰vivoX200系列,预计有X200、X200+和X200Pro三款新机
2024-09-20 14:08:00
这2万花得超值!MateXT首发日,余承东尼格买提现场交付
和iPhone16同日发布的华为MateXT非凡大师,抢走了苹果不少热度。巧的是,MateXT非凡大师的首发上市时间,也和iPhone16是同一天
2024-09-20 14:09:00
苹果高管:iPhone是世界上最流行的相机 甚至是唯一的
【CNMO科技消息】近日,苹果iPhone产品市场营销副总裁KaiannDrance接受媒体采访时表示,iPhone是世界上最流行的相机
2024-09-20 14:12:00
3000元买这些手机 长续航+好影像 国庆外出随便玩!
【CNMO科技导购】随着国庆假期的临近,许多人已经开始规划起自己的旅行计划。在这个数字化时代,一部性能出色的智能手机不仅能记录旅途中的美好瞬间
2024-09-20 14:13:00
已有消费者拿到iPhone 16系列 又是这两个国家最早
【CNMO科技消息】今日是9月20日,也是苹果iPhone16系列正式发货的日子。澳大利亚和新西兰的消费者已经开始收到他们预购的iPhone16
2024-09-20 14:13:00
保持克制、充满激情 哈啰2024云栖大会展示AI整体布局及大模型案例
2024年9月19日,哈啰亮相2024云栖大会,对外全面展示哈啰集团AI整体布局及其在大模型领域的实践成果。在哈啰展台
2024-09-20 14:13:00
英特尔称18A工艺即将落地:亚马逊成大客户
英特尔近年来在晶圆代工领域似乎没有什么特别好的消息,最新的财报也显示这家蓝色巨人遇到了相当大的挑战,就在近期,英特尔宣布即将开启新的转型
2024-09-20 14:15:00
做苹果最好的配件商,小米30W超薄磁吸无线充入网
据媒体爆料,小米新入网了一款30W超薄磁吸无线充产品,通过了3C认证,型号为MDY-170EY。输入:5-20Vdc3
2024-09-20 14:15:00
国产镜头卖10万美元?唯卓仕:正是在下
在消费者心目,国产镜头一直高性价比的代名词,不到原厂镜头1/4价格,就能提供相同的规格。不过在唯卓仕VILTROX在IBC2024期间
2024-09-20 14:16:00
还是老客户用着舒服:AMD赢下索尼PS6处理器合同
索尼已经发布了PS5Pro,尽管游戏机在绝对性能上比PS5高上不少,特别是光追性能,但是其高昂的售价却让大家骂声一片,因此对于拥有PS5的消费者来说
2024-09-20 14:16:00
小米8月成为全球第二智能手机品牌,小米14功不可没
近日,据市场调查机构数据显示,小米在今年8月的手机销量超过苹果,是仅次于三星的全球第二大智能手机品牌。作为国产五大品牌中发布新机最少
2024-09-20 14:16:00