正确率,长上,下文,模型,只是,能力头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科

【新智元导读】最近，一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后，一个仅80亿参数的小模型，在科学问题上也能和GPT-4o一较高下！或许，单纯地卷AI计算能力并不是唯一的出路。我们都知道，在...……更多

2024-12-03 13:34:00正确率,清华,模型,全新,科学,方法

Kimi概念股继续暴涨！多家上市公司回应，月之暗面致歉系..

...线。此前3月18日，月之暗面宣布其AI产品Kimi，在大模型长上下文窗口技术上取得新的突破，Kimi智能助手已支持200万字超长无损上下文，并于即日起开启产品内测。据了解，月之暗面成立于2023年4月，法定代表人杨植麟毕业于清...……更多

2024-03-21 22:44:00概念股,上市公司,多家,概念,公司,公司

谷歌推出datagemma开放权重语言模型新版本

...从数据共享平台检索相关信息来进一步提高回复的质量。长上下文窗口由Gemini1.5Pro实现，确保了回答的全面性和清晰度，同时引入了表格和脚注以提供更深层次的上下文。研究团队强调这些技术如何帮助大语言模型判断何时依赖...……更多

2024-09-13 20:42:00权重,模型,语言,开放,模型,数据

chatgpt背后模型被证实具有人类心智

...的心智理论（TheoryofMind，ToM），已经出现在ChatGPT背后的AI模型上。”这是来自斯坦福大学的最新研究结论，一经发出就造成了学术圈的轰动：这一天终于猝不及防地来了。所谓心智理论，就是理解他人或自己心理状态的能力，包...……更多

2023-02-12 23:46:00心智,模型,背后,人类,心智,测试

Google 创始人谢尔盖·布林回归，直面 Gemini、G

...。我想我们可以尝试一下。尽管今天我们更期待的是试验长上下文和一些技术特性。深入模型技术与安全在现场，布林多次提及了他对AI大模型发展的兴奋与期待。他的再次公开露面，将他对AI的热情尽现，他表示自己很热衷于...……更多

2024-03-11 11:28:00谢尔盖,布林,谢尔,创始人,问题,布林

微软开源 OmniParser 纯视觉 GUI 智能体：让

...前屏幕解析技术中的空白。该工具并不需要依赖额外的上下文数据，可以理解更复杂的图形用户界面（GUI），是智能 GUI 自动化领域的一项令人兴奋的进展。 OmniParser 结合可交互区域检测模型、图标描述模型和 OCR 模块等，不需...……更多

2024-10-30 09:47:00微软,截图,屏幕,视觉,智能,模型

常见电子邮件分类算法的性能分析

...)。从图1可看出，随着训练量(Train examples)的增大，训练集正确率下降，测试集正确率上升，最后稳定在0.84左右，准确率一般，但方差较小，具有较强的抗过拟合能力。图2.决策树图2为决策树学习曲线，红色线代表测试集(学习过...……更多

2024-08-26 09:59:00性能分析,算法,电子邮件,性能,常见,邮件

OpenAI GPT-4 AI 模型无需额外训练可通过日本理

...格的问题时显得有些吃力。该模型在常规问题上的表现（正确率为 80.1%）远远好于实际问题（正确率为 46.6%）。同样，GPT-4 在处理纯文本问题（正确率为 80.5%）时的表现也远好于那些带有图片和表格的问题（正确率为 35.4%）。...……更多

2024-09-02 09:54:00可通,理疗,日本,模型,训练,考试

36氪晚报｜第四范式与临港集团发布战略合作；上海启元与TEM

...工智能创业公司“月之暗面”（Moonshot AI）宣布在大模型长上下文窗口技术上取得新的突破，Kimi智能助手已支持200万字超长无损上下文，并于即日起开启产品“内测”。苹果正在商谈让谷歌的大模型Gemini为iPhone的AI功能提供支持...……更多

2024-03-19 00:20:00阿布扎比,阿布,属地化,金融家,临港,范式

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...这是该团队在继 PMC-LLaMA 后，在持续构建开源医疗语言大模型的最新进展。该项目受到科创 2030—“新一代人工智能” 重大项目支持。在医疗领域中，大语言模型已经有了广泛的研究。然而，这些进展主要依赖于英语的基座模型...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

首个AI程序员上岗，码农们暂且不必过度焦虑

...人工智能）程序员已经宣布正式上岗。据报道，国内某大模型企业近期正在内部推行AI编程，使用大模型辅助程序员写代码、读代码、查BUG（漏洞）、优化代码等。这一AI程序，还被分配了正式的员工工号，据企业相关人士透露...……更多

2024-04-07 13:55:00程序员,焦虑,程序,程序员,模型,程序

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...写入过程不涉及训练。每个引用都是独立处理的，避免了长上下文注意力的成本。读取成本：在推理过程中，显式记忆从驱动器中检索，并与通常的上下文键值一起由自注意力读取。每个记忆由来自少量注意力头的极少量键值组...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

AI大模型也高考？成绩单出来了，星火综合第一

...科技的数学评测中，讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队，智谱清言、阿里通义则以50%的正确率位居第二梯队，其他大模型相对落后。在量子位的高考数学评测中，虽然没有给出详细成绩单，但展示了各家...……更多

2024-06-12 09:29:00星火,成绩单,模型,成绩,高考,综合

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

...种“无效努力”不仅浪费计算资源，还显著降低了答案的正确率。“三心二意”是罪魁祸首这一现象在解决数学竞赛题等更为复杂任务时尤为明显。为了系统分析，团队在三个具有挑战性的测试集MATH500、GPQA Diamond和AIME2024上，对...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...规模、大批量的高配任务进行了优化，也具有100万token的长上下文窗口。谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍，Gemma 2采用全新架构，参数上达到27B，拥有突破性的性能和效率。AI助手Project Astra叫...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

谷歌没开源的 PaLM，网友给开源了

... conceptofmind/PaLM这三种模型在谷歌C4数据集进行了训练，上下文长度为8k。未来，还有20亿参数的模型正在训练中。谷歌C4数据集开源PaLM使用4.1亿参数模型生成的示例:Mydogisverycute,butnotverygoodatsocializingwithotherdogs……更多

2023-05-13 17:42:00网友,模型,训练,数据,生成,脚本

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...闭源大模型。目前在评测集上 o1-preview 都仅刚过及格线 (正确率 63.8)，其他大部分模型都处于低分状态，其中 GPT-4o mini 仅 37.6 分，ChatGLM3-6B 和 Qwen2.5-1.5B 仅 11.2 和 11.1 的准确率。基于中文 SimpleQA，我们对……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...随后，他们开始进行大量的测试。期间发现，如果只使用正确率作为最终的测试结果，并不能完全体现本次算法的优势。由于对大模型的请求是有成本的，所以当算法在使用大模型解决数学问题时，算法会设置一个针对大模型的...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

阿里大模型，再次开源大放送

...试中可以看到，Qwen1.5-72B一些分数上已经超过了GPT-4。在长上下文支持上，全系列模型的能力都有一定的拓展。尤其Chat模型，像Qwen1.5-7B-Chat这样的小模型，在5个任务中有4个表现与GPT-3.5相当。而Qwen1.5-72B-Chat的性能，则明显优于G...……更多

2024-02-20 14:45:00阿里,模型,再次,模型,多语,能力

最新迭代人工智能模型生物结构预测准确率显著提升将助力药物研

...由谷歌DeepMind和Isomorphic Labs团队研发的最新迭代人工智能模型AlphaFold3，能以较高准确率预测蛋白质与其他生物分子相互作用的结构，其准确率比之前的专用工具显著提升。AlphaFold3能预测含有蛋白质数据银行(Protein Data Bank)内几乎...……更多

2024-05-09 11:54:00迭代,准确率,人工智能,药物,人工,模型

大模型+家电的终极想象：人与机器共生的未来

...挑战。参考文献：1.机器之心，《大模型的最大bug，回答正确率几乎为零》，2023.92.飞哥说AI，《大模型的下半场：多模态、Agent、ToPC/ToSMB商业模式》，2023.93.甲子光年，《稚晖君独家撰文：具身智能即将为通用机器人补全最后一...……更多

2023-11-16 11:32:00终极,模型,机器,智能,模型,技术

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人

...二。根据论文摘要，DeepSeek团队认为，业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而，随着序列长度的增加，标准注意力机制的高复杂度成为了关键的延迟瓶颈。据了解，NSA通过高效的长序列处理能力...……更多

2025-02-19 12:26:00文锋,技术论文,创始人,论文,技术,推理

张宣科技：技术攻关助力废钢验质智能化

...型的自学习、自完善、自更新，提高各料型自动判级综合正确率，为废钢采购全流程智能化验质提供技术保障。该公司根据现场需求，积极展开靶向技术攻关。权万红带领技术团队认真查看废钢定级系统中的车次分层拍照质检情...……更多

2023-11-09 18:47:00废钢,攻关,智能,技术,科技,废钢

谷歌AlphaFold 3在《自然》杂志刊登：准确率超50%

...歌旗下公司DeepMind创建的基于深度学习的人工智能测序式模型AlphaFold解决了这个问题。北京时间5月8日（周三）晚间，《自然》杂志刊登了DeepMind的AlphaFold团队和伦敦药物研发公司IsomorphicLabs共同署名的论文，介绍了AlphaFold3，这是...……更多

2024-05-12 23:11:00准确率,自然,杂志,结构,蛋白质,蛋白