推理,模型,思维,语言,社区,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

第二届世界科学智能大赛启动向全球发起选手招募

...需要结合快思考的‘黑盒’预测和慢思考的‘白盒’逻辑推理，打造‘灰盒’可信大模型。具体而言，通过融合科学规律、观测数据和合成数据，开发理解物理世界的垂直领域科学大模型。”作为本届大赛评委会主席，上智院院...……更多

2024-07-05 14:45:00第二届,招募,选手,大赛,智能,科学

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

...质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。3.最强中文语言建模能力：中文语言建模困惑度评测，超越所有中文开源模型 Skywork-13B系列大模型在中文语言建模方面表现出色，具有优秀的中文文创...……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

智谱AI新一代基座大模型GLM-4在司南评测中跻身前列，位居

...水平。”OpenCompass 2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现，客观中立地为大模型技术创新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个，已有包括Meta、阿里巴巴、...……更多

2024-02-04 14:00:00司南,基座,前列,新一代,模型,评测

备战2024高考·名师指导｜高考生物有六大命题趋势，最后阶段

...知识综合应用能力的考查，注重对信息获取与加工、逻辑推理与论证、科学探究与思维建模、批判性思维与辩证思维、语言组织与表达等方面的考查。”她说，生物学科考查生物学核心素养，考查科学思维和逻辑推理能力及科学...……更多

2024-05-13 21:44:00高考,命题,名师,考生,复习,趋势

支持1024帧、准确率近100％，英伟达「LongVILA」

...微调，(4) LLM 的上下文扩展，以及 (5) 长监督微调。对于推理，MM-SP 解决了 KV 缓存内存使用率的挑战，这在处理非常长的序列时会成为瓶颈。通过使用 LongVILA 增加视频帧数，实验结果表明该研究在 VideoMME 和长视频字幕任务上的...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

NeurIPS 2024|水印与高效推理如何两全其美？最新理

... sampling）结合，在为大语言模型加入水印的同时，提升其推理效率，降低推理成本，因此适合用于大规模生产环境。这项研究发表在了 Nature 杂志上，给出了两种具体的结合方法，分别在水印检测效果和生成速度上达到了现有最...……更多

2024-11-22 09:49:00水印,推理,理论,水印,方法,投机

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

...于复杂数据关系的理解能力，还赋予了其基于先验知识的推理与推断能力。这一过程实现了知识数据与大模型的深度融合与相互促进，使得机器能够更加精准地把握人类语言的深层含义，并在实际应用中展现出更高的精准度与鲁...……更多

2024-09-23 09:53:00算法,落地,模型,价值,科技,数据

高通发布新款云ai推理加速卡

近日，高通公司发布了新一代云AI推理加速卡——CloudAI100Ultra。这款产品专为生成式AI和大型语言模型而设计，提供相当于上一代产品四倍的性能。新款CloudAI100Ultra可部署的模型规模进一步扩大，单张150W的卡上可部署100B参数模...……更多

2023-11-16 09:38:00加速卡,高通,推理,高通,加速卡,高通公司

人工智能大模型陆续上线加速赋能产业发展

...8.3倍。效率方面，文心大模型训练速度达到原来的3倍，推理速度达到原来的30多倍。科大讯飞董事长刘庆峰介绍，自5月6日首次发布讯飞星火认知大模型以来，已进行两次重大迭代升级，在文本生成、语言理解、知识问答、逻辑...……更多

2023-10-17 07:35:00人工智能,产业发展,人工,模型,智能,产业

字节、阿里云大降价之后，百度：两款主力大模型全面免费

...是百度自研的轻量级大语言模型，兼顾优异的模型效果与推理性能，适合低算力AI加速卡推理使用。ERNIE Speed则是百度的自研高性能大语言模型，通用能力优异，适合作为基座模型进行精调，能更好地处理特定场景问题，同时具...……更多

2024-05-21 17:30:00云大,阿里,字节,主力,模型,模型

GPT-4o的识图能力有多牛？四大维度深度体验

...，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完全合...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

科学家提出大模型分子交互学习框架，已在400多万分子对中验证

...用底层分子交互机制之间的共享，更透彻地调动大模型的推理能力和知识储备能力。大模型可能是一个“慢热型的 i 人”基于上述原因，课题组打算开发一款统一的大语言模型分子交互学习框架。研究期间，他们面临的第一个...……更多

2024-03-07 10:44:00分子,科学家,框架,模型,验证,科学

vivo蓝心大数据模型，为什么这么受欢迎？

...、知识问答、自然对话的700亿蓝心大模型70B以及适合逻辑推理以及任务编排的1300亿蓝心大模型130B以及1750亿蓝心大模型175B。而700亿蓝心大模型70B在SuperCLUE、C-Eval、CMMLU等多个榜单中排名第一，并将70亿规模蓝心大模型7B开源。同...……更多

2023-11-02 02:58:00模型,数据,模型,系统,生成,手机

苹果大模型，不藏了

...存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文，直指大模型落地iPhone等“内存有限”设备的方法。进入新年，Siri助手将搭载生成式模型Ajax的消息，再次不胫而走。去年六月和九月的两次重要发布会，苹...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

苹果黑科技将彻底改变iPhone 已有重大进展

...已经攻克了其中的重要技术挑战，可以最大限度减少AI在推理过程中，对于闪存和内存的占用，从而将推理延迟降低了4-5倍。而且，如果将其运行在GPU上，那么加速效果将提升20-25倍。一旦实现，就可以让智能手机真正部署大语...……更多

2023-12-24 19:50:00进展,苹果,科技,语言,智能,论文

【地评线】东湖评论：勇立科技革命的浪潮之巅

...次重大迭代升级，文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面的功能也在逐步完善。这些大模型的应用领域日益扩大，从知识问答到内容生成，再到创意策划和编程辅助等多种场景需求...……更多

2023-10-19 12:11:00东湖,浪潮,革命,评论,科技,科技

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

若愚科技推出九天机器人大脑，大模型总参数规模达130亿｜项

...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。基于自研的基于语言大模型和多模态大模型，若愚科技构建了多模态具身决策大模型，凭借人类世界通用知识和强...……更多

2023-12-26 09:36:00九天,机器人,大脑,模型,机器,参数

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

英伟达最新技术分享：手把手教你用Llama 3.1合成数据改

...05B开源巨兽Llama 3.1最近正式上线，既可用于批处理和在线推理，也可以作为基座模型，进行特定领域的专门预训练或微调。尤其是考虑到Llama 3.1有如此大的参数规模，加上丰富的15.6T token训练数据，非常适合用于数据生成。这篇...……更多

2024-07-30 09:38:00手把,英伟,最新技术,模型,代码,数据

德国OpenAI加入开源大战！发布欧洲纯血版模型，曾获博世和

...（Group Query Attention，GQA）的技术。Aleph Alpha声称这提高了推理速度，且几乎没有牺牲质量。模型还采用了“旋转式位置编码”（Rotary Position Embedding，RoPE）的方法，使模型能够更好地理解句子中单词的相对位置。二、注重模型合...……更多

2024-08-28 09:43:00博世,纯血,惠普,欧洲,德国,模型