• 我的订阅
  • 头条热搜
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...CLM-Baseline取得了更高的平均分,且在ARC(小学生科学问题推理)、HellaSwag(常识推理)、MMLU等任务上表现更好。 “小”模型成新趋势回到开头,“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”,其中包含1...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
百度文心一言发布会详细纪要
...话体现出文心一言各方面的能力,比如总结分析的能力、推理的能力。事实性的东西对于一个搜索引擎来说不是那么难,但是对于一个生成式预训练大模型来说,出错的概率还是挺高的,这些问题都答对相当不容易,因为百度的...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
...小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。近日,苹果和 Meta AI 的一个研究团队提出了一种新方法,可在保证准确度不明显下降的...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
...Bootstrap3D 数据集已全面开源。北大博士生等全新 BoT 框架推理暴涨 70 倍,24 点图形推理一步成神:BoT 可有效提升 LLM 在多个任务上的性能,在 BoT 的加持下,Llama3-8B 在多项任务中的性能甚至超越了 Llama3-70B,且 BoT 的成本相对较...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出特别的技...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
系统级玩家微软、苹果先后出牌,端侧大模型路径清晰了?
...MGSM(跨语言数学能力)提升 2.3%,而DROP(文本段落分析推理)则下降了 3%。但与此同时,杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据,早在去年6月,ChatGPT流量即已见顶,当月其网站与移动客户端的全球流量(PV)...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...数据对用户和内容进行建模,会导致新笔记分发难,缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中,率先将大模型作为笔记的语义编码器来使用,通过语义压缩提示词(prompt)结合对比学习技术,让大模型能够把笔...……更多
GPU受限,国内AI大模型能否交出自己的答卷?
...伟达又不负众望,推出了适用于ChatGPT的专用GPU,可以将推理速度提升10倍。 但值得注意的是,自2022年9月,美国禁止向国内客户售卖英伟达A100、H100和AMD的MI250人工智能芯片。基于此,针对中国用户,英伟达按照A800操作模式(A10...……更多
一块GPU都没用,苹果自研大模型干翻GPT-4?
...参数。报告首次对AFM的模型架构、训练数据、训练过程、推理优化及评估结果进行了解读,并提到背后模型的训练采用的是累计10240颗谷歌TPU,而未提及英伟达GPU。根据论文描述,苹果自研大模型在指令遵循、文本总结方面测试...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...地,也一定要对时间、数字和逻辑敏感,无论让它做多跳推理,还是逻辑规则数字计算,而这些恰好是大语言模型所不擅长的,包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此,我们认为在垂直领域落地的时候,大语言...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示,不同于仅仅识别图像中的物体,具有具身感知能力的智能体必须在物理世界中移动并与环境互动,这需要对三维空间和动态环境有更透彻的...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
比LoRA更高效的模型微调方法来了——以常识推理为例,在参数量减少8~16倍的情况下,两种方法能达到相同效果。新方法名叫LoRA-Dash,由来自上海交通大学和哈佛大学的研究人员提出,主要针对特定任务微调模型往往需要大量计...……更多
更多关于科技的资讯:
vivo“双机”再次确认:关键配置均清晰,均主打性价比方向!
都知道vivo今年的发展节奏非常快,这对于友商来说,市场冲击力也是非常的大,原因是需要跟上其脚步才可以,不然会被甩开。而从目前的手机市场来看
2024-09-23 14:44:00
华为Mate70系列外观被确认:电源键指纹+椭圆镜头
作为华为旗下的高端旗舰系列,Mate系列一直以其卓越的性能、创新的设计以及强大的品牌影响力让用户产生选择的欲望,这也是每年都很值得期待的地方
2024-09-23 14:44:00
三星S25系列三版本均入网:外观、配置、系统基本没悬念了
对于三星手机,想在竞争激烈的国内市场中掀起高热度真的会变成一件十分困难的事情,原因是如今的市场竞争实在是太激烈了。要知道在此前的市场中
2024-09-23 14:44:00
科学家发现月球表面到处都是水的迹象
说到水,月球可能有点像一匹黑马。根据对矿物学地图的一项新分析,水和羟基 —— 另一种由氢和氧组成的分子 —— 可以在月球所有纬度和地形的多个地点找到
2024-09-23 14:45:00
俄罗斯核导弹发射场,一夜间被夷为平地,现场惨状被卫星拍下
俄罗斯战略导弹发射场出大事了?“萨尔马特”导弹的发射场疑似被炸出一个巨坑,现场一夜间被夷为平地,惨状被西方卫星拍下。根据海外商用卫星拍摄的卫星图
2024-09-23 14:45:00
苹果自研5G基带:不支持毫米波!折叠iPhone:或明年见!
iPhone手机在国内市场中的影响力还是很高的,尤其是iPhone16系列正式开售之后,更是引起了很多消费者的关注,甚至是选择购买
2024-09-23 14:45:00
华为迎来双喜:鸿蒙NEXT Beta招募再次延长
华为手机这几年的市场发展速度真的可以用夸张来进行形容,不仅让旗下的多个系列新机进行了很大幅度的迭代,还带来了外围参数的提升
2024-09-23 14:45:00
天玑9400处理器:跑分再次浮出水面
在智能手机市场的激烈竞争中,处理器的性能始终是消费者关注的焦点,尤其是芯片工艺得到很大幅度提升之后更是如此。因为芯片工艺的提升往往需要几年才会进行提升一次
2024-09-23 14:45:00
小米15突然入网:90W有线快充+三超特性,价格告别3999
随着十月科技盛宴的临近,我们有理由相信,未来的智能手机市场将会更加精彩纷呈,原因是新机的数量实在是太多了。仅仅是要进行迭代的天玑9400新机
2024-09-23 14:45:00
荣耀“双机”迎来确认:Magic7系列、X60系列都有新动向
新荣耀手机如今的动作速度确实不快,虽然市场中也会传出一些新机的爆料,然而却没有多少新机进行发布,这也导致用户关注度不高
2024-09-23 14:46:00
vivo X200 mini再被确认:融合超分算法+潜望镜头
在小屏手机市场中,新机之间的竞争并不算特别的夸张,一方面是新机的数量方面并不多,主攻这个方向的厂商也很少。另一方面则是小屏手机目前都在路上
2024-09-23 14:46:00
iQOO良心旗舰,直面屏+120W闪充+电竞芯片,骁龙8Gen3加持
当时间来到这会儿,手机市场开始热闹,各大厂商纷纷推新,发布会一个接着一个,苹果华为不必多说,旗舰领域要垄断了,而中高端方面的话
2024-09-23 14:46:00
2024第4届中国焙烤行业峰会将于10月17-18日与在武汉举办
第9届秋季焙烤展将同期举办由中国焙烤食品糖制品工业协会、北京贝克瑞会展服务有限责任公司共同主办的第4届中国焙烤行业峰会(Bakery China Summit)将于10月17-18日在武汉国际会议中心举办
2024-09-23 14:48:00
微星为旗下主板提供基于AGESA 1.2.0.2 BIOS
前段时间,华硕率先发布基于AGESA1.2.0.2微码的测试版BIOS,主要针对旗下的ROG和TUF系列的600系主板
2024-09-23 14:48:00
下一代Xbox产品微软或采取新策略:由传统游戏主机和掌机组成
最近索尼推出了PlayStation5Pro,和上一代游戏主机里的PlayStation4Pro定位相同,属于半代升级版本
2024-09-23 14:48:00