• 我的订阅
  • 头条热搜
...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理,打造‘灰盒’可信大模型。具体而言,通过融合科学规律、观测数据和合成数据,开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席,上智院院...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型 Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...水平。”OpenCompass 2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个,已有包括Meta、阿里巴巴、...……更多
备战2024高考·名师指导|高考生物有六大命题趋势,最后阶段考生这样复习
...知识综合应用能力的考查,注重对信息获取与加工、逻辑推理与论证、科学探究与思维建模、批判性思维与辩证思维、语言组织与表达等方面的考查。”她说,生物学科考查生物学核心素养,考查科学思维和逻辑推理能力及科学...……更多
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...微调,(4) LLM 的上下文扩展,以及 (5) 长监督微调。对于推理,MM-SP 解决了 KV 缓存内存使用率的挑战, 这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数,实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
... sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上,给出了两种具体的结合方法,分别在水印检测效果和生成速度上达到了现有最...……更多
浩鲸科技鲸智BI大模型发布,从算法炫技到价值落地
...于复杂数据关系的理解能力,还赋予了其基于先验知识的推理与推断能力。这一过程实现了知识数据与大模型的深度融合与相互促进,使得机器能够更加精准地把握人类语言的深层含义,并在实际应用中展现出更高的精准度与鲁...……更多
近日,高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计,提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大,单张150W的卡上可部署100B参数模...……更多
...8.3倍。效率方面,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。科大讯飞董事长刘庆峰介绍,自5月6日首次发布讯飞星火认知大模型以来,已进行两次重大迭代升级,在文本生成、语言理解、知识问答、逻辑...……更多
字节、阿里云大降价之后,百度:两款主力大模型全面免费
...是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,能更好地处理特定场景问题,同时具...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...,准确率高达100%。图片来源:GPT-4o四、手写指令和逻辑推理最后,记者上了点难度,用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美,不仅准确识别了手写体文字并遵照指示,且答题逻辑完全合...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...用底层分子交互机制之间的共享,更透彻地调动大模型的推理能力和知识储备能力。 大模型可能是一个“慢热型的 i 人”基于上述原因,课题组打算开发一款统一的大语言模型分子交互学习框架。研究期间,他们面临的第一个...……更多
vivo蓝心大数据模型,为什么这么受欢迎?
...、知识问答、自然对话的700亿蓝心大模型70B以及适合逻辑推理以及任务编排的1300亿蓝心大模型130B以及1750亿蓝心大模型175B。而700亿蓝心大模型70B在SuperCLUE、C-Eval、CMMLU等多个榜单中排名第一,并将70亿规模蓝心大模型7B开源。 同...……更多
苹果大模型,不藏了
...存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内存有限”设备的方法。进入新年,Siri助手将搭载生成式模型Ajax的消息,再次不胫而走。去年六月和九月的两次重要发布会,苹...……更多
苹果黑科技将彻底改变iPhone 已有重大进展
...已经攻克了其中的重要技术挑战,可以最大限度减少AI在推理过程中,对于闪存和内存的占用,从而将推理延迟降低了4-5倍。而且,如果将其运行在GPU上,那么加速效果将提升20-25倍。一旦实现,就可以让智能手机真正部署大语...……更多
...次重大迭代升级,文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面的功能也在逐步完善。这些大模型的应用领域日益扩大,从知识问答到内容生成,再到创意策划和编程辅助等多种场景需求...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
新智元报道编辑:乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注,但最近浙大、中科院等机构的学者们提出,先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...业基准测试中达到了 SOTA,并提供了新的功能,如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道,“得益于预训练和后训练的改进,我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示,后期...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...05B开源巨兽Llama 3.1最近正式上线,既可用于批处理和在线推理,也可以作为基座模型,进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模,加上丰富的15.6T token训练数据,非常适合用于数据生成。这篇...……更多
德国OpenAI加入开源大战!发布欧洲纯血版模型,曾获博世和惠普投资
...(Group Query Attention,GQA)的技术。Aleph Alpha声称这提高了推理速度,且几乎没有牺牲质量。模型还采用了“旋转式位置编码”(Rotary Position Embedding,RoPE)的方法,使模型能够更好地理解句子中单词的相对位置。二、注重模型合...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...一个视频创作平台,如何应对AI算力托管、AI模型治理、推理加速等方面的挑战?如果算力被“卡脖子”了,如何能让大模型平稳部署在信创设备上?对于小型团队来说,如果微调大模型还是门槛过高、流程过长的话,如何通过...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
协同发展,生态聚合丨1024程序员节暨「源聚一堂」开源技术沙龙(北京站)成功举办
...台上优化GenAI开源工具》,如英特尔在基于量化加速的LLM推理部署中,基于CPU指令集,为大语言模型的量化以及高效推理设计的代码库BigDL-LLM优化方案。优化部署 AI 推理的开源工具包OpenVINO,在非量化加速中提供键值缓存、算子...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...能计算领域的探索与创新。他指出,大规模训练、高性能推理及海量算力治理是AI落地面临的三大挑战。为此,vivo构建了大模型工程体系,解决了大规模训练的问题,让模型能按天迭代;解决高性能推理的问题,能秒级生成图片;...……更多
李彦宏:开源模型将会越来越落后 | 最前线
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。其中,推理成本的大幅下降,对于大模型降低应用门槛意义最大。也就是说,客户原来如果一天调用模型1万次,现在同...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力,使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后,业内相关讨论始终层出不穷。据现有信息汇总,Q*项目被视作OpenAI在探索人工通用智能(Artificial General Intelli...……更多
更多关于社会的资讯:
莱芜农商银行辛兴分理处:跨越千里的暖心守护
鲁网9月24日讯“真是太感谢你们了!我远在石家庄都能感受到家乡的温暖,父亲的银行卡问题解决了,我们全家都安心了。”近日
2025-09-24 10:23:00
□邱爱金王典今年是中国人民抗日战争暨世界反法西斯战争胜利80周年。八十载岁月更迭,沧海桑田,但历史的记忆依然熠熠生辉,民族的精神赓续绵延
2025-09-24 07:38:00
这里不是枯燥的书本式教育,而是发生在你我身边的真实案例;这里不是单向的口头宣传,而是带你沉浸式体验,真切感受各种诈骗手段
2025-09-24 07:52:00
跟着“头号生活玩家”苏东坡,一键卸载内耗| 新刊推荐
你是否有过这样的时刻?明明很努力,却没有收到应有的待遇;明明很谨慎,却一不小心捅出了篓子;明明将一些人和事视若珍宝,却在他人眼中轻如鸿毛……当自己被生活摁在地上时
2025-09-24 06:26:00
【多彩新论】让家风家训成为廉洁文化的“源头活水”
家风家训是涵养廉洁文化的“源头活水”。安顺西秀区本寨村的“四知堂”,东汉名臣杨震“暮夜却金”的故事穿越千年时空,在石头城里回响
2025-09-24 06:46:00
他用热血,让生命“怒放”
本报讯 (全媒体记者邬强、陈春伟) “我想要怒放的生命,就像飞翔在辽阔天空……”近日,在第十一个“世界骨髓捐献者日”主题宣传暨造血干细胞捐献者交流活动现场
2025-09-24 05:52:00
“文润高新 文化课堂”2025年高新区海岸读书会精彩启幕
胶东在线9月19日讯(通讯员 郭健)为营造“书香高新”全民阅读浓厚氛围,深化“文润高新·文化课堂”品牌建设,9月13日
2025-09-24 05:37:00
招远市卫健系统成功举行地震灾害医疗救援综合演练
胶东在线9月19日讯 9月9日上午9时,招远市卫生健康局在招远市人民医院东停车场组织开展地震灾害医疗救援综合演练。此次演练以检验应急响应机制
2025-09-24 05:37:00
教师的故事⑬ | 童心筑童梦,让孩子快乐成长
【编者按】当数字化浪潮席卷课堂,当“双减”政策重塑教育生态,当AI技术叩响未来之门,一批新时代教师正勇立潮头,以青春之姿解锁教育新篇
2025-09-23 21:36:00
医院影像科报告单上出现脏话,市卫健局介入调查,涉事医院发布情况说明
大皖新闻讯 9月22日,有网民发视频称,辽宁省新民市人民医院出具的影像科报告单中竟出现了骂人的脏话,引发热议。23日,记者联系了新民市卫健局
2025-09-23 22:45:00
中国网9月24日讯 据“市说新语”微信公众号消息,为加强直播电商监管,保护广大消费者合法权益,各级市场监管部门依法履职尽责
2025-09-24 00:43:00
今天上午,河南省00后女子黄某醉驾致三人死亡一案开庭审理。受害者董某某母亲代女士表示,事故发生一年来,肇事者未向家属支付任何民事赔偿
2025-09-24 02:04:00
“靠桥吃饭”的好日子来了|世界第一高桥下的创业故事
俗话说“靠山吃山,靠水吃水”,出生在贞丰县平街乡的林国权,怎么也没想到,有一天也能过上“靠桥吃饭”的日子。“快看,这就是即将通车的世界第一高桥
2025-09-23 23:29:00
大皖新闻讯 日前,黄山市统计局发布《2025年1-8月全市经济运行简析》,其中,1-8月,全市景区共接待游客3321.9万人次
2025-09-23 23:53:00
全封闭施工道路!黄山市交警、住建部门加强管控
大皖新闻讯 目前,黄山市中心城区屯溪黎阳龙山路(黎阳学府小区段)道路施工在抓紧进行,虽然该施工路段属全封闭管控,但因施工车辆进出频繁
2025-09-23 22:45:00