• 我的订阅
  • 头条热搜
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出特别的技...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
...展开紧密协作,共同致力于本土算力和大型模型的训练与推理技术的发展。11月初,云从科技在投资者关系平台上答复投资者关心的问题时称,公司已与华为签署了全面合作框架协议,并已联合发布了从容大模型训推一体化解决...……更多
昇思MindSpore 2.3全新发布
...级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLMServing实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。 为降低开发门槛,昇思持续升级MindSpore...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...学习还能决策可以看到,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。...……更多
...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后,LLM审查MCTS的思想并识别任何错误,然后进行额外的MCTS模拟以生成修改后的想法。最后,将修改后...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官...……更多
...方案规划、目标拆解能力;判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力;道德中枢具有情感分析、道德法律能力;记忆中枢具有信息记忆能力。此外,360以安全大模型为“大脑”,构建出智能体框架,通过任务...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...策略的任务级泛化。此外从概念上讲,利用 GenSim,LLM 的推理和编码能力通过中间合成的模拟数据被提炼成了语言 - 视觉 - 行动策略。‍‍论文地址:https://arxiv.org/pdf/2310.01361.pdf‍GenSim 框架由以下三部分组成:同时该框架通过两...……更多
...模型已与华为昇腾AI基础软硬件完成适配:支持Atlas300Ipro推理卡,具备int8量化能力;支持Atlas训练服务器,用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理。 ……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...tra 的得分高达 90.0%,超过GPT-4的86.4%。同时,Gemini Ultra 在推理、数学、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新...……更多
大语言模型如何宣告心理学的死亡?
...数据的相关性连接,以及作为表征数据内部相关性连接的推理规则和推理方法。当这些连接达到一定的密度和连通性时,LLM似乎展现出了推理的能力。但这种能力更多是因为它们处理大量相关性连接时所表现出的复杂性,而不是...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...在侯震宇看来,是AI生态发展的关键一年。一方面,算力推理层和模型训练工具链的优化,将是2024年的重点。他表示:“2024年我觉得算力的整体供应不确定性或紧张程度较大,所以如何能够更有效使用算力资源,是一个大家都...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神经网络提供快速、低水平、灵巧的机器人动作。机器人所做出的所有行为都是出于已经学习过,内化了的能力,而不是来自远程操作。研究...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...用底层分子交互机制之间的共享,更透彻地调动大模型的推理能力和知识储备能力。 大模型可能是一个“慢热型的 i 人”基于上述原因,课题组打算开发一款统一的大语言模型分子交互学习框架。研究期间,他们面临的第一个...……更多
更多关于科技的资讯:
据gamesradar+当地时间周五报道,Netflix在观众指出问题后,撤下了一张疑似由AI生成的《英雄联盟:双城之战》第二季海报
2024-11-24 21:58:00
三星为其北美市场的 Galaxy 手机/平板的“三星游戏中心”应用新增云游戏服务,用户无需耗费流量/存储空间安装手游,即可利用网络远程畅玩
2024-11-24 21:59:00
真显眼包!Caviar定制款Vision Pro亮相
11月21日消息,说起Caviar,大家最不陌生的就是他们推出的各种定制款手机了,堪称数码界的奢侈品。现在,他们又开始对苹果VisionPro下手了
2024-11-24 22:33:00
字母全部大写!Redmi变成REDMI,这次不用花200万
前不久有细心的网友发现Redmi红米手机公众号名称更改为“REDMI红米手机”,据此推测红米可能会迎来新的品牌标识升级
2024-11-24 22:34:00
RTX 4050显卡继续生产不停产:新的太贵怕消费者不接受
目前NVIDIA已经开始全力为RTX50系显卡做着准备,其中就包括停产海量的RTX40系显卡,我们也报道过由于NVIDIA的停产
2024-11-24 22:34:00
OPPO Find X8 Pro体验:双潜望长焦加AI
相信去年OPPOFindX7系列给不少喜爱影像的小伙伴留下了深刻的印象,Ultra版本双潜望长焦配置一枝独秀,再加上不断OTA更新优化体验
2024-11-24 22:35:00
AMD计划2026年推出UDNA架构显卡
关于AMD下一代显卡实在是没有什么特别期待的,毕竟就现在的消息可知,AMDRadeonRX8000显卡基于RDNA4架构打造
2024-11-24 22:35:00
紧跟苹果脚步:三星也要推出Galaxy S25 Slim手机
目前关于iPhone17Air手机的消息是越来越多,例如苹果希望将其打造成苹果旗下最为轻薄的iPhone手机,不过也有消息称
2024-11-24 22:36:00
iPhone再现bug,备忘录数据丢失,苹果紧急给出修复方案
11月19日消息,近年来,苹果时不时会出现一些极为影响使用体验的bug,近日,就又爆出了丢失备忘录的bug。据部分用户反馈
2024-11-24 22:36:00
苹果M4 Max 在显卡渲染测试中超越RTX 4070
前不久我们曾报道,苹果M4Max相较于最新的英特尔酷睿Ultra9285K以及AMDRazen9950X在CPU单核与多核性能上都具有领先的优势
2024-11-24 22:36:00
开始青苗不接了:RTX 50系显卡还没到,40系显卡开始断货
NVIDIARTX50系显卡可以说是目前最受大家关注的显卡,尤其是RTX50系显卡更是如此,特别是RTX5090这样的显卡巨兽
2024-11-24 22:36:00
英特尔又要挤牙膏:酷睿Ultra 200U纯马甲
英特尔目前似乎在CPU市场上频频触壁,刚刚推出的酷睿Ultra200S处理器在游戏性能上也是落后于AMD的锐龙9000系处理器
2024-11-24 22:36:00
vivo X200 Pro影像体验:一个月后再看,还是真香!
2024年底的新机上市来得更早,刺刀见红也比去年更猛。MTK比去年早了约一个月,在10月9日发布新一代旗舰SoC天玑9400
2024-11-24 22:37:00
OPPO Reno 13公布外观:四种配色,11月25日发布
随着11月中旬的到来,下半年的第二批手机即将陆续和大家见面,这些手机相比较首批旗舰手机更加偏向于年轻用户,因此整体外观更加时尚
2024-11-24 22:37:00
AMD统一架构显卡2026年推出 同架构GPU将用于PS6
此前AMD已经官宣将再度统一游戏显卡以及服务器显卡的架构,在后续产品当中引入统一的UDNA架构。而最新的爆料表明,AMD基于下一代UDNA架构的Radeon游戏显卡将于2026年第二季度投入量产
2024-11-24 22:38:00