• 我的订阅
  • 头条热搜
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...赋予了类似人类三到六岁儿童水平的智慧,使得机器人在推理、决策、环境感知和规划方面的能力得到了质的飞跃。”孙腾说。瞄准给机器人装上多模态大脑这一方向,若愚科技打造的自己的基础模型,且采用了机器人数据进行...……更多
中兴通讯引领算力时代:投资智能计算基础设施与大模型训练推理
...于算力领域,并致力于智能计算基础设施、大模型的训练推理算法以及工程优化的研究和开发。#中兴通讯绿色算力主力军#在算力领域,大模型的技术和应用已经成为一个趋势。大模型是一种基于深度学习技术的自然语言处理模...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...选择问答任务外,研究还扩展到评测各种大型语言模型的推理能力具体来说,对于给定的问题和选项,模型在输出选择答案的同时,还需要输出选择该答案的理由。下表展示了主流模型在 MMedBench 上对选择题答案的解释能力。主...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
自定义Llama 3.1模型的利器来了!NVIDIA打造生成式AI代工厂,还有加速部署的微服务
...24日报道,NVIDIA宣布推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务,与刚推出的Meta Llama 3.1系列开源模型一起,为全球企业的生成式AI提供强力支持。Llama 3.1大语言模型有8B、70B和405B三种参数规模。模型在超过16000个NVI……更多
阿里云挥出“三板斧”:免费也要挣到钱
...炼平台、灵积(DashScope)平台等,为用户提供模型训练、推理等所需的算力服务。这些平台不仅支持阿里云的通义系列,还集成了Llama、ChatGLM等系列开源大模型。用户通过API接口,能够在阿里云的公共云上直接调用这些模型,在...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...化。因此,他在后续研究中将探索如何利用大语言模型的推理能力,来辅助现有模型学习到更好的关于视频的表征,从而提供一个更好的视频编码器,构造一个能力更强、功能更多的多模态大模型。参考资料:1.https://arxiv.org/pdf/...……更多
ChatGPT搜索搞不定勾股定理新证明 但国产AI可以!
...天工AI搜索在此次升级之后,不仅可以对复杂问题的分析推理与逐步解决,还针对学术和金融等这些强需求的领域做针对性的优化。 嗯,着实是上了一波大分。怎么做到的?天工AI的最新搜索能力远非简单的关键词匹配,而是通...……更多
谷歌苹果曝出LLM惊人内幕,自主识别错误却装糊涂!AI幻觉背后藏着更大秘密
...生成错误答案。幻觉,如何定义?事实错误、偏见,以及推理失误,这些统称为「幻觉」。以往,大多数关于幻觉的研究,都集中在分析大模型的外部行为,并检查用户如何感知这些错误。然而,这些方法对模型本身如何编码、...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...GPT、还是文心一言等闭源模型,一定比开源模型更强大,推理成本更低。”在2024世界人工智能大会(WAIC 2024)期间,百度创始人、董事长兼首席执行官李彦宏,与第一财经传媒集团总编辑杨宇东和《硅谷101》创始人陈茜,进行...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
AI泡沫不可避免!李彦宏敲响警钟:PMF是生存关键
...苹果研究员最近发布了一篇名为《理解大语言模型中数学推理局限性 》的论文,质疑大语言模型的数学推理能力,甚至认为大语言模型不具备真正的推理能力,放弃造车、战略押注AI的苹果甚至放弃了OpenAI的新一轮投资机会。与...……更多
百川智能发布baichuan3稳定语言模型
...处理和代码生成领域的强大实力。不仅如此,其在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上的中文效果同样超过了GPT-4,是中文医疗任务表现最佳的大模型。Baichuan3还突破“迭代式强化学习”技术...……更多
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...练及优化策略如果你已经亲自测试过,就会发现可灵支持推理过程中同样的内容输出多种视频宽高比。这是因为可灵采用了可变分辨率的训练策略,目的是满足更丰富场景中的视频素材使用需求。与此同时,得益于高效的训练基...……更多
o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
...共有8点:1 强化学习加持的o1,比人类更善于发现新的CoT推理步骤2 自我批评的涌现,是o1最强有力的时刻3 让o1「超时」前完成回答,然后突然有了「啊哈」时刻 4 scaling参数规模的挑战,以及继续沿着强化学习算法进步之路5 许...……更多
什么影响大模型安全?NeurIPS\'24新研究提出大模型越狱攻击新基准
...即可提供细粒度的越狱评分(评分范围从1到10),并伴随推理解释。JAILJUDGE Guard不仅在评估精度上超越了现有的顶级模型(如GPT-4和Llama-Guard),还在闭源和开源安全模型上展现了强大的评估能力,同时具备更高的效率和更低的...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
字节、阿里云大降价之后,百度:两款主力大模型全面免费
...是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,能更好地处理特定场景问题,同时具...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...视为专家,自动将训练样本划分到对应的组件进行微调。推理阶段:HydraLoRA 通过训练完成的路由器,灵活且动态地合并多个 B 矩阵,以满足不同任务和数据的需求。这样的设计使得模型能够高效地适应多样化的应用场景,提升...……更多
世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类
...eak Accept的水准。世界首个「AI科学家」诞生了!现在的大模型已经可以独立搞科研,甚至完全不需要人类插手。这不,它刚刚一口气连肝了10篇论文。从提出研究想法、实验、写代码,再到GPU上执行实验,收集结果,AI承包了整...……更多
中国银河证券:Sora将推动推理端算力占比将大幅提升
...。目前OpenAI已加入算力芯片军备竞赛中,根据OpenAI论文,推理阶段算力需求是模型参数数量与训练数据集规模乘积的2倍,Sora将推动推理端算力占比将大幅提升。此外,通信端等配套实施需要全方位升级,网络上行下载速度需大...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
...系统,可为医生在诊疗过程中,全程提供全面的疾病诊断推理及相似病例推荐等服务;模型中的人工智能体,通过先进的Agent技术,高效检索、分析妇产领域前沿学术动态,让医生时刻站在医疗科研领域最前沿,赋能临床医生,...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...的数据训练出的大模型,在部分场景的确会让人感觉逻辑推理能力更强。”但他强调,“大模型的训练数据更应追求平衡性,弱智吧这样的数据的确会对逻辑推理能力有一定帮助,但在解决实际问题时,往往需要更广泛的覆盖不...……更多
AIGC落地应用:腾讯云如何助力产业智能化升级?
...同的模型形态,采用混合专家模型(MoE)结构,提高训练和推理效率及专业领域适应性,具备强大的中文创作能力。 腾讯混元大模型构建三层自主可控的国产大模型全栈技术架构:上层为自研高速网络互联来支撑模型训练,预计20...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...英伟达,老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人(近1个半小时),但一大波网友已经看完并交起了作业(开始卷了是吧!)网友:学起来!学起来! 黄仁勋:未来推理的增长将远...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...碾压谷歌此次发布的Llama3大模型,相较于上一代在编码、推理等性能上取得了显著进步。Meta公布的九项行业基准测试评测结果显示,Llama3-8B参数版本几乎全面碾压谷歌的Gemma和Mistral的70亿模型。Llama3-70B参数版本则在7项评测中超...……更多
知乎 AI 革命:智能搜索与实时问答的融合
...生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个 " 新鲜出炉 " 的专业问题提供一个立等可取的答案,提问的用户就可以能为快,然后再等其它的专业答主陆续赶到,下场答题。 在灰度测试这个功能的...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
更多关于科技的资讯:
人工智能不仅能分析人脸情绪,还能读取脑电波信号,为人定制香氛;恐龙变为AI数字虚拟形象,成为人们的“萌宠”——这不是科幻电影
2025-09-30 08:09:00
从线上学习到山水修行:简知文旅×简橙教育共同打造银发文旅的深度与温度
近日,长江三峡见证了一场别开生面的银发游学盛事。"三峡简橙号·年度盛典"游学项目在历时七天的精彩行程后圆满落下帷幕。该项目由简知科技旗下两大知名品牌"简知文旅"与"简橙教育"联合策划执行
2025-09-30 08:17:00
聊城智汇 链接全球丨锚定国际市场,力得汽车科技加速布局海外
齐鲁晚报·齐鲁壹点 国晓宁 崔宇晴走进山东力得汽车科技股份有限公司的生产车间,机器轰鸣声不绝于耳,一条条先进的生产线正有序运转
2025-09-30 09:20:00
国庆黄金周变身“家电焕新周”,三联家电门店人气爆棚
随着国庆与中秋双节同庆的长假来临,消费市场迎来了一年之中最炙手可热的“黄金销售季”。与以往不同的是,这个假期在旅游、探亲等传统主题之外
2025-09-30 09:22:00
壹点观察 | 蔚来城商业广场十一开业,德州商业格局再迎新变化
在商业竞争日益激烈的今天,一座全新的商业综合体——蔚来城商业广场,即将于十一正式开门迎客。它的到来,为德州商业市场增添了新的变化
2025-09-30 09:24:00
鲁网9月29日讯(记者 杨勇)秋分时节,聊城市莘县升鑫金属制品有限公司的生产车间内,员工工作紧张有序,各种机器设备高效运转
2025-09-30 10:04:00
Aritco与Dezeen联合举办设计论坛 共探\
苏州2024年9月16日 -- 近日,瑞典家用电梯品牌Aritco瑞特科与全球知名设计媒体Dezeen设志在苏州联合举办了一场主题为"摒弃风格
2025-09-30 10:18:00
小微企业在传统银行承兑汇票(简称“银承”)业务办理中常常面临诸多难题。企业需要多次往返银行网点,提交大量纸质材料,流程烦琐
2025-09-30 10:45:00
中国数据研究中心:中之杰荣膺月饼行业智造先锋奖榜首
9月28日,中国数据研究中心正式发布《2025中国月饼行业白皮书》及“2025中国月饼行业智造先锋奖”十强品牌榜单,吉林中之杰食品科技发展有限公司凭借其位于长春的智能新厂
2025-09-30 11:15:00
鲁网9月30日讯近日,省科技厅公布了2025年度科技型中小企业创新能力提升工程(先投后股类)项目名单,全市共4家企业入选
2025-09-30 11:16:00
浪潮海晏荣获2025年“数据要素×”大赛山东分赛决赛三等奖
近日,由国家数据局、山东省人民政府联合指导,山东省大数据局等21家单位联合主办的2025年“数据要素×”大赛山东分赛决赛获奖名单正式公布
2025-09-30 11:21:00
据人民日报报道,近期国家网信办指导多地网信部门,对微博、快手、小红书、今日头条等多家平台进行约谈,责令限期整改热搜热榜存在的问题
2025-09-30 12:33:00
朱琳:品牌要让Z世代体验“设计师”般的快感
齐鲁晚报·齐鲁壹点 记者 牟静萍 实习生 葛同同 当下,Z世代正在以其独特的消费观念、多元的兴趣取向和对精神体验的重视
2025-09-30 12:46:00
大皖新闻讯 算力作为数字经济时代的核心生产力,已成为城市竞争的关键赛道。“十四五”期间,芜湖紧抓“东数西算”国家战略机遇
2025-09-30 13:57:00
把握国庆中秋消费节点,三联家电双节大促开启家庭焕新计划
鲁网9月30日讯国庆中秋长假,历来是家庭消费,特别是家电消费的黄金周期。许多家庭会选择在此期间,集中完成筹划已久的家电焕新计划
2025-09-30 14:55:00