• 我的订阅
  • 头条热搜
苹果发布 OpenELM,基于开源训练和推理框架的高效语言模型
...,苹果在 Hugging Face 平台上发布了一个“具有开源训练和推理框架的高效语言模型”,名为 OpenELM。当然,这是一项开源语言模型,其源码及预训练的模型权重和训练配方可在苹果 Github 库中获取。IT之家将官方简介翻译如下:参...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...布了两篇新的研究论文,介绍了 3D 头像和高效语言模型推理的新技术,被认为可能带来更身临其境的视觉体验,并允许复杂的人工智能系统在 iPhone 和 iPad 等消费设备上运行。 AI 社区中的许多人后来才注意到 Ferret 的发布,他...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
苹果展示ferret-uiai系统可理解应用程序
...指令来设计的,以便于精确引用和接地。为了增强模型的推理能力,我们进一步编制了高级任务数据集,包括详细描述、感知/交互对话和功能推理。苹果在论文中表示相比较现有的GPT-4V,以及其它MLLMs模型,Ferret-UIAI模型更为优...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出特别的技...……更多
英伟达地表最强,黄教主被称作AI界“霉霉”
...来支持高达10万亿参数的AI模型训练和大语言模型的实时推理。有望在数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成人工智能等领域实现新的突破。用黄仁勋的原话来说,它就是“当今世界上最...……更多
探索终端操作系统领域AI大模型创新趋势 OpenHarmony技术大会OS原生智能分论坛召开
...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
苹果公司公布“mm1”多模态大模型
...0亿、70亿、300亿三种参数规模,拥有图像识别和自然语言推理能力。IT之家注意到,苹果研究团队相关论文主要是利用MM1模型做实验,通过控制各种变量,找出影响模型效果的关键因素。研究表明,图像分辨率和图像标记数量对...……更多
...展开紧密协作,共同致力于本土算力和大型模型的训练与推理技术的发展。11月初,云从科技在投资者关系平台上答复投资者关心的问题时称,公司已与华为签署了全面合作框架协议,并已联合发布了从容大模型训推一体化解决...……更多
昇思MindSpore 2.3全新发布
...级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLMServing实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。 为降低开发门槛,昇思持续升级MindSpore...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。可以说,2023年...……更多
对话王田苗:万亿市场之下,大模型 + 机器人还有四大问题未解决
...务设定多个小模型,并提供不同的参数训练,端到端减少推理成本。另外,将专用小 GPU 芯片置入到机器人中,也可提高任务实时性,目前特斯拉已在自动驾驶中尝试了这种做法。硬氪:今年有哪些细分场景的模型值得关注?王...……更多
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...学习还能决策可以看到,Figure 01不管是在理解能力,还是推理反应都非常强大。团队特别强调,所有这些行为都没有经过远程操作,而是通过机器人自主学习。并且整段视频没有任何加速,也没有任何剪辑,全部一镜到底拍摄。...……更多
...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后,LLM审查MCTS的思想并识别任何错误,然后进行额外的MCTS模拟以生成修改后的想法。最后,将修改后...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...加速器将为寻求大规模部署生成式AI的企业带来AI训练和推理方面的重大飞跃。英特尔Gaudi 3预计可大幅缩短70亿和130亿参数Llama2模型,以及1750亿参数GPT-3模型的训练时间。英特尔表示,Gaudi 3能够比英伟达上一代H100处理器训练特定...……更多
科大讯飞大模型新升级:20秒制作PPT,拟人语音能力超越ChatGPT|最前线
...台训练的全民开放大模型。升级后的讯飞星火V3.5在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等七大能力上均有提升。升级之后,讯飞星火的文本生成能力和数理运算能力都有提升,可以轻松回答初三的数学物...……更多
马斯克 xAI 推出 Grok-1.5 大语言模型
...宣布,正式推出 Grok-1.5 大语言模型。Grok-1.5 具有改进的推理能力和 128k 的上下文长度,其中最显著的改进之一是其在编码和数学相关任务中的表现。Grok-1.5 将在未来几天内在 平台上向早期测试人员和现有的 Grok 用户推出。在官...……更多
...方案规划、目标拆解能力;判别中枢具有信息抽取、逻辑推理、是非判断、研判检测能力;道德中枢具有情感分析、道德法律能力;记忆中枢具有信息记忆能力。此外,360以安全大模型为“大脑”,构建出智能体框架,通过任务...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...完成上面说的第二个步骤,模型中没有思维链,也不具备推理能力。PaLM-E 让机器人有了聪明的大脑,可以将复杂自然语言指令分解为简单指令,完成上面说的第一个步骤,然后再去调用 RT-1 执行动作。所以,PaLM-E 所做的只是自...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...策略的任务级泛化。此外从概念上讲,利用 GenSim,LLM 的推理和编码能力通过中间合成的模拟数据被提炼成了语言 - 视觉 - 行动策略。‍‍论文地址:https://arxiv.org/pdf/2310.01361.pdf‍GenSim 框架由以下三部分组成:同时该框架通过两...……更多
...模型已与华为昇腾AI基础软硬件完成适配:支持Atlas300Ipro推理卡,具备int8量化能力;支持Atlas训练服务器,用户可使用昇思MindSpore和PyTorch框架进行模型训练和推理。 ……更多
苹果推出DeepPCR 神经网络训练和推理速度提升7倍
...该算法通过并行处理常规顺序操作,可以加速神经网络的推理和训练过程。尽管神经网络已能处理文本或图片合成、分割和分类等复杂任务,但由于计算需求过大,神经网络训练和反馈结果的时间可能需要数天或者数周。目前广...……更多
谷歌 VS OpenAI:当搜索霸主和屠龙少年迈入同一条河流
...tra 的得分高达 90.0%,超过GPT-4的86.4%。同时,Gemini Ultra 在推理、数学、代码等方面的表现也都高过GPT-4。而作为首个「原生多模态」模型,在一系列多模态基准测试中,对标GPT-4V,Gemini Ultra 也展现出了先进的性能。图源:谷歌新...……更多
大语言模型如何宣告心理学的死亡?
...数据的相关性连接,以及作为表征数据内部相关性连接的推理规则和推理方法。当这些连接达到一定的密度和连通性时,LLM似乎展现出了推理的能力。但这种能力更多是因为它们处理大量相关性连接时所表现出的复杂性,而不是...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...在侯震宇看来,是AI生态发展的关键一年。一方面,算力推理层和模型训练工具链的优化,将是2024年的重点。他表示:“2024年我觉得算力的整体供应不确定性或紧张程度较大,所以如何能够更有效使用算力资源,是一个大家都...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...破,由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解,而 Figure 的神经网络提供快速、低水平、灵巧的机器人动作。机器人所做出的所有行为都是出于已经学习过,内化了的能力,而不是来自远程操作。研究...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...用底层分子交互机制之间的共享,更透彻地调动大模型的推理能力和知识储备能力。 大模型可能是一个“慢热型的 i 人”基于上述原因,课题组打算开发一款统一的大语言模型分子交互学习框架。研究期间,他们面临的第一个...……更多
更多关于科技的资讯:
酷冷至尊推出M.2 SSD散热器Kaze:双均热板超薄设计
快科技10月13日消息,酷冷至尊(CoolerMaster)震撼发布全新M.2 SSD散热器——“Kaze”,专为追求极致被动散热效能的用户量身打造
2024-10-13 18:45:00
Intel Xe3第三代显卡开始行动!酷睿Ultra 300首发
很多人怀疑Intel Xe显卡还做不做,是不是会放弃,但至少到第三代是不会丢掉的,相关的部署工作已经悄然展开了。Intel日前发布的代号Lunar Lake的酷睿Ultra 20
2024-10-13 19:45:00
撒哈拉沙漠暴雨引发洪水 当地人:已有三五十年未见
快科技10月13日消息,据媒体报道,撒哈拉沙漠的部分区域遭遇了一场数十年难遇的降雨盛况,降雨量之大实属罕见,以至于在某些地段
2024-10-13 20:15:00
史上第一款!华擎Z890太极OCF主板默认支持DDR5 10GHz+
快科技10月13日消息,Intel Arrow Lake酷睿200S系列将内存频率支持从DDR5-4800提高到DDR5-6400
2024-10-13 20:45:00
“公交医生”自制防冻液加注器
每到秋季,公交行业就开始进入冬运准备“模式”,给公交车加注防冻液是其中必不可少的一项工作。以往,驾驶员或维修工用瓶子一点点往水箱里加
2024-10-13 20:59:00
“老人味”可能是大病前兆!这4种气味 一定小心
生活中,我们走进中老年人的房间或靠近中老年人交谈时,有时可能闻到一股奇怪的味道。蜡烛、乳酪、旧书、油……人们对这种特殊体味的描述多种多样
2024-10-13 21:15:00
东台农商银行举办员工业务技能比赛
江南时报讯 为进一步激发员工学习业务、钻研技能的热情,持之以恒提升金融服务效能和规范化服务水平,近日,东台农商银行举办了2024年员工业务技能比赛决赛
2024-10-13 21:20:00
决战四季度 夺取全年胜丨让传统制造更“聪明” 浙江加速推进工业企业数字化改造
中国蓝新闻 作为制造业和数字经济大省,今年以来浙江设定“年底前实现规上工业企业数字化改造全覆盖”的目标,通过企业数字化转型
2024-10-13 22:33:00
钱江观潮丨追梦人
中国蓝新闻 地面,领航者二号从容行走,举重若轻;天空,朱雀三号吟啸腾飞,剑指苍穹。新质生产力奔涌的背后,一群“追梦人”在浙江大地上奋力奔跑
2024-10-13 22:33:00
首次“筷子”夹大火箭!SpaceX星舰一级回收成功:全程完美
北京时间10月13日20点25分,SpaceX星舰在美国得州的星港发射场点火成功。这是星舰的第五次试飞,超级重型一级助推器B12回收成功
2024-10-13 22:45:00
美国男子沉溺“人造羊”:非法克隆巨型羊 有特殊目的
因为对羊做了“不可思议”的事,美国蒙大拿州男子前段时间被抓判刑。如果仅仅是从科学角度来看待这个案件,那么律师将男子的所有努力
2024-10-13 22:45:00
本田passport现身rebellerally越野拉力赛
10月12日消息,汽车媒体carscoops今天(10月12日)发布博文,报道称2026款本田Passport现身RebelleRally女子越野拉力赛
2024-10-13 19:58:00
小鹏P7+电驱细节图首次公开!最大能力放开达270kw
快科技10月13日消息,小鹏汽车动态体验产品总监近日公开了小鹏P7+的电驱爆炸图,并透露了一些关键信息。他指出,在工信部公告的两款车型(180kw
2024-10-13 16:45:00
为电动汽车增添乐趣!本田有望推出电车专用模拟变速箱
快科技10月13日消息,据媒体报道,本田正在研发一项新技术,旨在为电动车带来类似手动挡的驾驶体验。该公司的工程师透露,本田正在开发一款模拟手动变速装置
2024-10-13 16:45:00