• 我的订阅
  • 头条热搜
从“智能涌现”到“超人类”,通往AGI巅峰的终极设想
...总结历史上的定义,并在此基础上提出了他们对AGI的定义框架[12]。从理论到实践:定义AGI的六大原则从这些过去定义AGI的尝试中,研究人员发现了一些共同特征,并从中提取出定义AGI所必须满足的六大原则:1.注重能力,而非过...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...途,必须提前获取 Mistral AI 商业许可证。性能表现在多项评估指标上,Mistral Large 2 刷新了性能和服务成本的新标准。特别是在 MMLU 上,预训练版本实现了 84.0% 的准确率。代码与推理Mistral AI 基于此前 Codestral 22B 和 Codestra……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...完成,论文共同一作Wei Fan、Haoran Li。团队提出了一个新框架,基于情境完整性理论来调整大语言模型使其符合隐私法律,提高其在不同情境下检测隐私风险的能力。Formality is Favored: Unraveling the Learning Preferences of Lar……更多
加州大学团队开发异构编程新模型,开辟提升处理器性能新路径
...(Hung-Wei Tseng)领导的研究团队,提出了一种以新的软件框架提高现有计算机处理速度的方法,为我们提供了一种新的性能提升思路。图丨曾宏伟(来源:加州大学河滨分校)为了处理不同类型的数据,现代计算机大都集成了多...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
... 对比了标准 LLM 与 LazyLLM。LazyLLM图 4 展示了 LazyLLM 的整体框架。从完整上下文开始,LazyLLM 会逐渐对 token 进行剪枝,从而逐渐减少得到最终模型所使用的计算数量。请注意,LazyLLM 允许模型在不同的生成步骤选取不同的 token 子集...……更多
...产业应用、选型参考”原则,采用科学严谨的测试方法,评估大模型在内容安全、数据安全和科技伦理等方面的表现。该体系将覆盖合法合规、隐私保护、文明健康、人工智能自主意识等27个维度的中文评测数据集,为行业提供...……更多
单卡搞定Llama 3.1 405B,让大模型轻松瘦身!超强压缩工具包来了
...型相当的精度表现。LLMC:一站式大模型瘦身工具包△LLMC框架图支持多种算法。LLMC 支持多种压缩算法,包括 16 种不同的量化方法,涵盖仅权重、权重激活和混合精度量化。这种多样性允许对不同方法进行公平比较和深入分析。...……更多
建筑业碳排放占37%,奥雅纳呼吁建立数据生态体系
...内权威检测机构国检测试控股集团上海有限公司签署战略框架协议,合作开发建筑隐含碳测算及认证服务。其将建筑分为六大层级,可在项目设计或完成阶段针对每个层级的隐含碳以及减碳量进行测算评估。对企业而言,拥有隐...……更多
不花一分钱!GPT-4o微调限时免费开放,每日附赠百万训练token
...了分层安全缓解措施,例如不断对微调模型运行自动安全评估并监控使用情况。网友:微调比不上提示词缓存一片热闹之际,有网友认为微调仍然比不上提示词缓存。微调很酷,但它仍然不如提示词缓存…… 之前量子位也介绍...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...正确性,发现数据集的质量有一定的保证。为了能进一步评估合成数据的质量,作者还为图表、表格和路线图这三个任务构建了额外的训练集,共包含62,476条指令(图1)。基准测试论文共对12个模型进行了测试,详细结果如表A1...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...他们将这个智能体称为Agent K v1.0,这是他们的结构化推理框架 Pangu-Agent 的一个扩展,但它也是专门为应对数据科学挑战设计的。该团队为 Agent K v1.0 引入了新的内部函数类别,以便在自动解决数据科学任务之前自动设置它们。他...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...4谁能笑到最后?谷歌对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现。从自然图像、音频和视频理解,到数学推理等任务。数据上看,Gemini Ultra是首个在 MMLU(大规模多任务语言理解数据集)任务表现上优于...……更多
3人干翻谷歌!免费学术搜索比谷歌学术相关性高5倍,已获YC投资
...c Scholar和谷歌学术搜索结果的相关性和精确度。直接检测评估了每个搜索引擎的前10个搜索结果,对比如下: 在基础搜索模式下(Lumina Base),Lumina搜索结果的相关性比谷歌学术高4.8倍,比Semantic Scholar高8倍,评估基于生成的约2...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
...的智商相去甚远,但把它们放在极端的测试中不会很好地评估它们。 还有人劝诫道,朋友们,现在辞职太早了。加大难度:100、1000只鸡如何?为了得到较大的比率,Gowers这次给出了100只鸡过河的问题。这里虽没有放出具体的解...……更多
昆仑万维发布开源13B高质量商用大模型 领先Llama2和Baichuan2
...集之一。除此之外,Skywork-13B系列还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。五大特...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...选择了即时块间层共享(immediate block-wise sharing,图6b)。评估实验作者构建了125M和350M参数的MobileLLM/MobileLLM-LS模型,并在1T的数据集上进行训练。预训练后的模型在多个数据集上进行零样本测试,包括ARC-easy、ARCchalle……更多
初创公司推出全球首个ai软件工程师devin
...技术:只需阅读文档,Devin就能快速掌握不熟悉的工具和框架。开发端到端应用:构建并部署功能齐全的网络应用程序,根据用户反馈逐步增加功能。自动化查找BUG:Devin擅长识别、调试和修复代码问题,同时为开源和生产级软...……更多
富国基金旗下富国长期成长掌舵人谢家乐的投资之旅
...到想要买的标的或行业景气度。具体而言,谢家乐的投研框架,可以通过以下四张图来展示。一、投资理念:遵循价值 顺应周期遵循价值,评估价值中枢和安全边际、价值变化的时点、量级和速率。顺应周期,分析周期嵌套,...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
...为单独令牌。模型架构图如下所示: 三、MixCon 的实验与评估实施细节选择特定配置适应单块 80GB A800 NVIDIA GPU 的计算能力,实现质量和吞吐量的优化。序列由 4 个 MixCon 块组成,每个 MixCon 块含 8 层 L = 8,注意力层和 Conba 层比例...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...容易出错,主要难点在于开发出高效准确的检索机制。3. 评估困难:如果评估RAG系统的性能,特别是组件级别的性能,是一项复杂的任务,需要开发出能够准确评估数据检索和响应生成质量的指标。由于RAG已经算是一个相对成熟...……更多
...你会想尽一切办法让它快速发展。但你肯定需要社会制定框架来适应,无论是深度造假还是取代工作等等。这将成为一个前沿领域,与气候变化没有什么不同。这将是我们所有人在未来十年努力解决的最大问题之一。问:另一个...……更多
限定120分钟科研挑战,o1和Claude表现超越人类
...。事情是这样的——人类 VS AI科研能力大比拼,也有新的评估基准了。代号“RE-Bench”,由非营利研究机构METR推出,目的是搞清:当前AI智能体在自动化科研方面有多接近人类专家水平。注意看,一声令下之后,AI和50多位人类专...……更多
企业数据治理现状与神策数据解决方案全面解析
...么是数据治理数据治理是一个组织内部管理和使用数据的框架和实践的集合。它涉及到数据的创建、存储、访问、共享、保护和销毁等多个方面。数据治理的主要目的是确保数据的质量、可用性、一致性、安全性和合规性。数据...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...一小部分使用 3D 高斯泼溅来模拟创建的真实世界场景中评估学习到的控制器性能。这些基准环境的示例如下图 9 所示。此外,研究者进行了以下基线比较:需要特权地形数据(障碍)的专家策略; 使用相同 pipeline 训练的深度学...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...了TEGs研究的标准化流程,涵盖数据预处理、加载和模型评估等关键阶段。3. 研究人员进行了广泛的基准实验,并对基于TEGs的方法进行了全面分析,深入探讨了不同模型及不同规模pre-trained language models(PLMs)生成的嵌入的效果、...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
... 2允许开发者和研究人员共享和商业化创新成果。 广泛的框架兼容性:Gemma 2兼容主要的AI框架,如Hugging Face Transformers,以及通过Keras 3.0、vLLM、Gemma.cpp、Llama.cpp和Ollama原生支持的JAX、PyTorch和TensorFl……更多
谷歌公开“社会学习”ai框架
...歌近日公开了一项名为“社会学习(SocialLearning)”的AI框架,该框架允许AI语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的AI模型更具隐私保护性。据介绍,在这款“社会学习框架”中,...……更多
用AI自动设计智能体,数学提分25.9%,远超手工设计
...程有趣的新智能体。该研究为元智能体定义了一个简单的框架(100 行代码以内),为其提供了一组基本功能,例如查询 FM 或格式化提示。因此,元智能体只需要编写一个「前向」函数来定义一个新的智能体系统,类似于 FunSearch...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...署更加便捷和一致,LangChain为语言模型应用提供快速开发框架,Weights&Biases打造了供AI开发者训练和微调模型的MLOps平台……“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00