• 我的订阅
  • 头条热搜
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
谷歌推出aihypercomputer超级电脑架构
...型,承载学术实验及较短的训练任务,或进行蒸馏、离线推理及批量性的任务,计费标准主要基于AI任务所使用的GPU与TPU量。而Calendar模式则可替AI任务预留开始时间,适用于需要精确开始时间及模型训练持续时间的任务,计费标...……更多
chatgpt低成本复现流程开源
...。相比原生PyTorch,单机训练速度最高可提升7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2此次提供的90亿(9B)和270亿(27B)参数的两个版本,其推理性能和效率均优于第一代,并具有显著的安全性改进。事实上,270亿参数版本可以与体积超过其两倍的模型进行同等级别的竞争,并且提供了此前只有专有模型才能实...……更多
苹果黑科技将彻底改变iPhone 已有重大进展
...已经攻克了其中的重要技术挑战,可以最大限度减少AI在推理过程中,对于闪存和内存的占用,从而将推理延迟降低了4-5倍。而且,如果将其运行在GPU上,那么加速效果将提升20-25倍。一旦实现,就可以让智能手机真正部署大语...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
... 和 ChartQA,它们不仅需要理解,还需要对图表进行强大的推理能力。对于这两个基准,PaLI-3 稍微落后于 PaLI-X。另外,研究人员还扩展了 PaLI-3 的功能,使其能够通过语言类似的输出来预测分割遮罩。实验结果表明,对于这种类...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...大能力,分别为:文本生成、语言理解、知识问答、逻辑推理、数学和多模态能力,并且这种能力还在不断提升。而基于大模型开发所需的巨大投入量,科大讯飞也做了多方面的准备。一方面,科大讯飞积极展开与业内巨头的合...……更多
神州数码生成式AI战略升级,聚焦算力和AI应用工程平台研发|最前线
...于训练的高速成长阶段,基于我们对市场的理解,训练和推理的出货量大概在1:5 到1:6。随着未来人工智能在行业的深入应用,推理服务器会得到大量的部署。”AI应用工程平台也是神州数码接下来发力的重点方向。当前,企...……更多
掰开安卓手机 满屏都是三个字:大模型
...的内存单元,是大模型进手机面临的第二道难关:大模型推理需要大量计算资源做支撑,与此同时,内存大小决定了数据处理速度的上限以及推理的稳定性。另外,在手机上跑大模型,也给电池带来了更大的压力。因此芯片能耗...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
小模型正在成为AI界的新宠
...算法,超越了同等大小和稍大一号的模型,在各种语言、推理、编码和数学基准测试中表现优异。苹果紧随其后,发布了 OpenELM,包含了 2.7 亿、4.5 亿、11 亿和 30 亿四个参数版本。与微软的 Phi-3 一样,OpenELM 也是一款专为终端设...……更多
谷歌最新自然语言推理算法
谷歌发布全新反向推理算法LAMBADA,无惧搜索空间爆炸!自动推理绝对算是自然语言处理领域的一大难题,模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
...模型的短板,此前行业也多次讨论过大模型的数学和复杂推理能力较差,即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次,第一财经曾在6月报道过,根据司南评测体系OpenCompass的高考全卷测试,包括GPT-4在内,7...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
chatgpt低成本复现流程来了
...。相比原生PyTorch,单机训练速度最高可提升 7.73倍,单卡推理速度提升1.42倍,仅需一行代码即可调用。对于微调任务,可最多提升单卡的微调模型容量 3.7倍,同时保持高速运行,同样仅需一行代码。要知道,ChatGPT火是真的火,...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...当天开始,谷歌聊天机器人Bard将使用Gemini Pro来实现高级推理、规划、理解和其他功能。明年初,谷歌将推出Bard Advanced,其将使用Gemini Ultra,这代表了Bard发布以来的最大更新。从发布会当天开始,Pixel 8 Pro手机的两项功能将由Gem...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...外,HuggingFace上还发布了7B模型的指令微调版本,在数学推理任务GSM8K上的性能实现大规模提升,分数由原来的2.1直接飙到52.5。https://huggingface.co/apple/DCLM-7B-8k除了7B版本,1.4B版本也同步上线。神奇的是,训练数据量相比7B版本不……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言...……更多
...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕:它们犯下前后不一致的错误,而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明,大语言模型所依赖的语料库往往反...……更多
苹果计划年底推出M4处理器:全力提升AI性能
...通等竞品处于同一水平,此外考虑到大语言模型的训练与推理需要超大容量的存储,因此M4Ultra处理器或许将会支持512GB的内存,比现在的192GB提升了不少。苹果对于AI时代大幅落后于友商的现状其实还是很焦虑的,希望借助AI处理...……更多
手机数读 | Q1华为、荣耀并列国内市场第一,小米再次被挤出前五
...日凌晨,苹果在Hugging Face平台上发布了“具有开源训练和推理框架的高效语言模型”,名为 OpenELM,共有2.7亿、4.5亿、11亿和30亿这四种参数规模。王翔认为,各家都在AI上有布局,但苹果在国内市场受到的竞争压力还是非常大的...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...新包含Qwen-VL-Plus和Qwen-VL-Max两个版本,模型在图像相关的推理能力、图中文字识别和提取能力,以及支持高分辨率三个方面做了升级。据通义千问数据,相比于开源版本的Qwen-VL,这两个模型在多项图文多模态标准测试中获得了堪...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...评测方法、大模型如何能持续学习、怎么显著提升训练和推理的效率这等。从左起:吴海涛、肖仰华、王文广、蒋涛、林咏华、于建岗、王千祥、王昊奋复旦大学教授肖仰华:大模型绝不仅仅是模型系统和算力,数据是非常重要...……更多
ChatGPT一周年,机会在大厂还是小公司?
...。大模型还存在一些不足,包括如何做更高效果的架构、推理加速,训练加速等。如果面向未来智能体的发展,大模型仍然有很多模块欠缺,比如记忆能力、推理能力、规划能力等,包括现在大模型背后的一些机理,都不足以支...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...“天工2.0”MoE大模型,“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,“天工...……更多
英特尔发布全新软硬件平台,全速助力企业推进AI创新
...碎片化、数据可靠性和合规性等需求。推出用于AI训练和推理的Gaudi3英特尔Gaudi3AI加速器将为AI系统提供动力,该AI系统可通过以太网的通用标准连接多达数万个加速器。与上一代产品相比,英特尔Gaudi3将带来4倍的BF16AI计算能力提...……更多
斯坦福“草泥马”火了:100美元就能比肩gpt-3.5
...记本部署LLaMA的方法来自GitHub项目llama.cpp,使用纯C/C++做推理,还专门对ARM芯片做了优化。作者实测,M1芯片的MacBookPro上即可运行,另外也支持Windows和Linux系统。 还是这个C++移植版本,有人成功在4GB内存的树莓派4上成功运行了LL...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...的代表先后登台,对夸娥智算集群助力其在大模型训练、推理及具身智能的创新赞誉有加。加速一切大模型,只是第一步。张建中说,夸娥万卡集群不仅是加速AI,而是想要为美好世界加速。 一、大模型训练呼唤万卡集群,国...……更多
全球都在搞AI,为什么是百度挣到钱?
...,李彦宏透露,自发布以来,百度不断降低文心大模型的推理成本,目前已降低至2023年3月版本的1%。随着推理成本的降低,越来越多的用户和企业开始使用文心大模型。这意味着不论是对于企业还是开发者,基于文心大模型开...……更多
更多关于财经的资讯:
近日,网络流传的一张疑似零跑汽车PPT中写道:“汽车价格战的滚滚热浪中,零跑汽车也成为了备受瞩目的参与者。8月1日起,零跑汽车将做出重大战略调整
2024-07-29 19:46:00
16家银行密集披露半年工作会议内容:大行聚焦五篇大文章,中小银行强调风险与资产质量
进入七月,各家银行陆续召开年中会议,总结上半年业绩,布局下半年经营应对策略。截至7月29日,已有16家银行机构对外披露了年中会议的具体内容
2024-07-29 19:46:00
一品红跌超17%:子公司国家集采串标收2.66亿元罚单
国家药品集采又开出一笔高额罚单。7月29日,一品红药业股份有限公司(一品红,300723)大跌,盘中一度跌超19%,收跌17
2024-07-29 19:58:00
10组数据看新华保险理赔服务质量
鲁网7月29日讯近日,新华保险发布2024年理赔服务半年报。报告数据显示,2024年上半年,新华保险为236万人次提供理赔服务
2024-07-29 20:03:00
“金融圈手撕老板”?千亿机构最新声明:已报警
财通资管员工一事刷屏。近日,一份名为《金融圈手撕老板第一人》的举报材料在网络流传,疑似财通资管一研究员称,自己在朋友圈吐槽公司管理制度等问题后
2024-07-29 20:16:00
上半年基金赎回究竟多少?5000亿被指偏颇了,实情如何?
近日,公募基金二季度的赎回情况被市场热议。长江证券近期发布名为《主动权益基金持仓进一步集中》的研报中指出,主动权益基金二季度赎回超2000亿元
2024-07-29 20:16:00
涉集采违约、需退回2.66亿元,一品红股价大跌!律师:情节严重或涉及刑事处罚
7月29日开盘,知名药企一品红(300723.SZ)一度大跌19.52%,截至当日收盘,股价报15.5元/股,跌17.33%
2024-07-29 20:16:00
中国光大银行烟台分行:金融与科技双向奔赴 赋能企业高质量发展
大众网记者 李慧 烟台报道经济发展,科技先行。科创企业是加快新旧动能转换、推动经济提质升级的生力军,近年来科创类企业蓬勃发展
2024-07-29 20:22:00
上半年内地团客赴澳门85.1万人次,同比上升1.4倍
澳门城市风光 IC 资料图7月29日,中国澳门特区统计暨普查局披露的数据显示,今年上半年的随团入境(澳门)旅客有96.8万人次
2024-07-29 20:28:00
微信小游戏首度亮相ChinaJoy,助力开发者玩转小游戏
东方网7月29日消息:7月27日,中国游戏开发者大会小游戏发展论坛在上海举办。微信团队代表和优秀开发者团队代表亮相论坛
2024-07-29 20:28:00
农发行威海市分行开展夏粮收购工作
为集中做好粮食收购资金投放准备、优化服务等工作,农发行威海市分行认真落实“保收储、增供应、当主导、防风险”的工作要求,充分发挥粮食主办行职能
2024-07-29 20:37:00
发展势头强劲、持续历史高位,人民币国际化后续怎么走?
“人民币国际化依然呈现出强劲的发展势头”“人民币国际使用水平保持历史高位”“扎实提高人民币国际使用的广泛性和便利性”……近两日南开大学
2024-07-29 20:49:00
金融监管总局:切实将“四级垂管”优势转化为金融监管效能
北京商报讯(记者 宋亦桐)7月29日,来自金融监管总局官网信息,7月29日,金融监管总局召开学习贯彻党的二十届三中全会精神暨2024年年中工作会议
2024-07-29 20:49:00
涌金楼丨42家浙企上榜中国500强,谁变了
日前,《财富》杂志发布2024年中国500强榜单。今年上榜公司的年营收门槛约为37.4亿美元,较去年提升约9%。 参考企业注册地信息
2024-07-29 20:56:00
2024年7月底,无锡市中欧产业创新区组织开展了“向‘新’求变 高质量发展”科技创新·媒体行集中采访活动。中欧产业创新区党工委副书记
2024-07-29 21:16:00