• 我的订阅
  • 头条热搜
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强的多模态能力。同时,它的推理速度更快,支持更高的并发,大大降低推理成本。除此之外,GLM-4大幅提升了智能体能力,GLM-4 All Tools 实现自主根据用户...……更多
GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
...两个字母。在多次请求后,你都没有做出任何澄清或说明上下文,我无法继续进行富有成效的讨论了。如果你有真正的问题或希望解释你的观点,我可以提供帮助。否则,我们可能需要换一个话题最后,小哥承认,自己的prompt是...……更多
云从科技从容大模型荣登中国大模型第一梯队
...理解能力:74.8分的成绩证明了其在理解复杂语言结构与上下文含义方面的能力,排名国内前五。 从容大模型在与全球顶级模型GPT-4的直接对决中,取得了20.79%的对战胜率,这一成绩仅次于Claude3-Opus,进一步验证了其在实际应用...……更多
开源版OpenAI再出「神作」,小模型吊打Llama 3!Ministral系列问世,边缘AI革命开启
...界上最好的边缘模型Ministral 3B和Ministral 8B都支持高达128k上下文(目前在vLLM上为32k)。在知识、常识、推理、函数调用、效率等方面,为低于10B参数模型设立了新标杆。而且,Ministral 8B还有配备了滑动窗口注意机制(sliding-window a...……更多
OpenAI举办“AI春晚”;李开复大模型破纪录 | 图灵周报
...的Baichuan2-192K大模型之后,李开复的Yi系列模型再次刷新上下文窗口长度纪录——参数量达340亿的Yi-34B,可支持200K超长上下文窗口,可处理约40万汉字超长文本输入,是目前全球最长的上下文窗口。目前,零一万物估值超过10亿美...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...M替换T5作为文本编码器,并设计了复杂的人类指令,通过上下文学习来增强图像-文本对齐。 高效的训练和采样:提出Flow-DPM-Solver来减少采样步骤,并通过高效的标题标注和选择来加速收敛。基于以上的算法创新,相较于领先扩...……更多
库克现身上海首次谈及AI话题,苹果真急了
...一篇论文,公开了一个名为“MM1”的多模态模型,其具有上下文学习、图片识别和一定连续推理的能力。该模型具有三个参数规模,其中最大的拥有300亿参数。作为对比,OpenAI的GPT-4拥有1.7万亿参数规模。而几周前发布的新款Mac...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环...……更多
...还能直接跳转微信读书中该文本引用的页面,让用户通过上下文更好地理解问题。小米回应林斌副董事长减持:1.6 亿资金将用于公益项目小米集团联合创始人林斌在六月份连续三天减持股票,共套现约 1.79 亿港元,约合人民币 1...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...即整合时空依赖编码器,以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说,我们设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。上式 为初始化时空嵌...……更多
rtxai助手的进化
...Assist项目可接收玩家的语音或文字输入内容,游戏窗口的上下文信息,并通过AI视觉模型处理数据。这些模型增强了与游戏知识数据库相连的大语言模型(LLM)的上下文感知和对特定游戏及应用的理解,然后生成定制的回复,以文...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
...机视觉任务:图像去噪、边缘检测、姿态估计等 一定的上下文学习能力 (In-context Learning)以下简要展示部分能力效果:2.1 文本到图像生成 2.2 指代表达生成OmniGen 具备类似 InstandID、Pulid 等模型生成角色一致性图像等能力,即:输...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...之后,Llama 3.1 终于在昨夜由官方正式发布了。Llama 3.1 将上下文长度扩展到了 128K,拥有 8B、70B 和 405B 三个版本,再次以一已之力抬高了大模型赛道的竞争标准。对 AI 社区来说,Llama 3.1 405B 最重要的意义是刷新了开源基础模型的...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...备全新功能的模型,包括多模态、支持多语言对话、扩展上下文窗口的长度,以及全面提升的综合性能。 基于Llama 3,Meta发布了AI助手 Meta AI。扎克伯格表示,MetaAI将成为人们可以免费使用的最智能的AI助手。开源还是闭源?Llama...……更多
有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍
...少了4到20倍,具体加速效果取决于序列长度。例如,在1k上下文中,训练速度提高了4倍;在4k上下文中,提高了10倍;而在8k上下文中,更是提高了20倍。研究人员指出,nGPT的优化路径从超球面上的点开始,通过位移来贡献最终的...……更多
amd推出10亿参数语言模型系列amdolmo
...next-tokenprediction)进行训练,这种架构在生成文本和理解上下文方面表现出色。与其他同类开源模型相比,AMDOLMo在推理能力和聊天能力上表现优异。尤其是在多个基准测试中,其性能与最新的OLMo模型相当,且计算预算仅为其一...……更多
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代
...刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。来自中国的视频生成模型,再一次震惊了全球大模型圈。生数科技推出的Vidu 1.5,成为世界首个支持多主体一致性的多模态模型!...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...答、对话、写作、翻译等功能,后者则可以完成处理200K上下文、多文档阅读理解,以及超长知识库构建等任务。 今年3月6日,零一万物官微宣布开源Yi-9B模型。据介绍,Yi-9B是目前Yi系列模型中代码和数学能力最强的模型,实际...……更多
pytorchtorchao正式发布,提供了一系列优化工具集
...int4,并将键值缓存量化为int8,可令LLaMA3.18B在完整的128K上下文长度下仅占用18.9GB的显存。 ……更多
微软Copilot全面升级至GPT-4 Turbo模型
...Turbo模型由OpenAI于2023年11月首次发布,它提供了更大的128L上下文窗口,能够处理长达300页的单个文本提示。微软在12月首次宣布将支持ChatGPT-4Turbo,并将其作为CopilotPro服务的一部分,订阅费用为每月20美元。Copilot最初是基于GPT-3.5...……更多
mistralai公司推出mixtral8x22b开源模型
...出了Mixtral8x22B开源模型,共有1760亿个参数,Context长度(上下文文本)为6.5万个token,可以通过Torrent下载。MistralAI公司自成立以来一直备受外界关注,“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
微软与openai的合作源于对谷歌的担忧
...歌的BERT-large模型,这是一种可以解析句子中单词含义和上下文的人工智能模型。然而,由于微软的基础设施不足,他们花费了大约6个月的时间来训练模型。与此同时,谷歌已经拥有BERT模型至少六个月,并且有更多的时间来进一...……更多
谷歌开源系模型第二代免费开放!27B媲美Llama3 70B,单H100可跑
...能更高、推理效率更高,单个NVIDIA H100或TPU主机上可跑。上下文长度方面,Gemma 2为8192 Tokens。性能方面,Gemma 2与Llama 3、Grok-1基准测试结果对比如下:Gemma 2 9B得分全面超越Llama 3 8B,Gemma 2 27B模型表现接近Lla……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...、更便宜的GPT-4——GPT-4 Turbo,做出六大升级——更长的上下文长度、更强的控制、知识升级、多模态、模型微调定制和更高的速率限制。GPT-4的付费服务将“加量不加价”。 OpenAI还宣布,ChatGPT每周用户数量已达到1亿。自3月发...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...lan【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
加速AI落地企业!微软解读Copilot技术栈,云端混合大小模型是关键
...主动响应的Copilot。定制化的Copilot可通过记忆和知识了解上下文背景、推理需要进行的操作和行动,基于用户反馈进行学习,并主动寻求帮助,独立管理复杂、长期运行的业务流程。▲Copilot扩展的专属平台Microsoft Copilot Studio从IT...……更多
更多关于科技的资讯:
华为用户必看!换电池优惠50元、官方维修8.8折 错过等明年
快科技12月29日消息,距离2024年结束仅剩3天,华为服务回馈礼遇活动也将于12月31日正式收官,华为手机、平板等设备用户
2024-12-29 07:39:00
蔚来同步维权最新进展:多个账号被蔚来固定证据 已在多地法院起诉
快科技12月29日消息,蔚来汽车法务部日前发布消息称,和大家分享下公司近期依法维护自身权益的举措:“Super Wade”
2024-12-29 07:39:00
玉林迈入高铁时代 至南宁行程缩短至48分钟
快科技12月29日消息,近日,据官方获悉,南宁至珠海高铁南宁至玉林段(南玉段)将于12月30日开通运营,这标志着广西玉林迈入高铁时代
2024-12-29 08:09:00
SUV高速撞上隧道 发动机都被撞飞!司机:空调太暖 睡着了
快科技12月29日消息,公安部交通管理局今日分享了一起高速上疲劳驾车导致事故的案例。据介绍,12月18日凌晨4时许,浙江温丽高速向阳山隧道内
2024-12-29 08:09:00
京东何晓冬:AI大模型助力新质生产力 推动实体经济发展
本文转自:人民网京东集团副总裁、京东探索研究院院长何晓冬。人民网记者 翁奇羽摄人民网北京12月28日电 (记者王绍绍)在今日由人民网举办的“2024人民财经论坛”上
2024-12-29 08:22:00
女子半夜和男友吵架刷机票抢到3元票 平台:出票成功就能用
快科技12月29日消息,据报道,多位网友日前爆料称,自己抢到了海南航空明年1月4日从成都飞往北京的机票,票价3元,外加70元的机建燃油费
2024-12-29 08:39:00
量子AI+生物医药融合创新峰会在无锡滨湖举办
本文转自:人民网-江苏频道峰会现场。活动主办方供图。12月27日,量子AI+生物医药融合创新峰会在无锡滨湖区举办,峰会由图灵量子
2024-12-29 08:42:00
中国笔记本电脑最新销量出炉:联想销量销额双第一 AI PC立功
快科技12月29日消息,根据洛图科技发布的最新报告,2024年11月,中国大陆笔记本电脑线上公开零售市场的销量130万台
2024-12-29 09:09:00
韩国一客机发生坠落:机上载有181人 已有数十人死亡
快科技12月29日消息,据新华社报道,韩联社29日报道称,韩国务安机场飞机发生坠落,机上载有175名乘客,6名乘务人员
2024-12-29 09:09:00
“哪吒”航行器上天入海 创意奇思“落地生花”一批大学生创新创业成果亮相科交会,看似“不可能”的想法变成现实□南京日报/紫金山新闻记者 何洁“哪吒”不闹海了
2024-12-29 09:15:00
见“微”知著 敢为天下先
赵柏闻,1992年生,北京人。2004年起就读于人大附中,2008年进入中国农业科学院实习。2014年创立北京量化健康科技有限公司
2024-12-29 09:35:00
韩国载181人客机降落时撞击起火:全程被拍下 现场惨烈
12月29日消息,综合央视等报道,当地时间今日上午9时左右,一架韩国济州航空客机在韩国南部全罗南道务安国际机场降落过程中冲出跑道
2024-12-29 09:39:00
无人快递车撞上问界M9!车主:无人车跟碰瓷一样 减速后又加速撞了上了
快科技12月29日消息,据报道,杭州问界M9车主沈先生,在驾车出车位时,被后方驶来的一辆无人快递车撞上,交警判定沈先生主责
2024-12-29 10:09:00
AI教父辛顿发声:30年内AI致人类灭亡几率达10%-20%
快科技12月29日消息,2024年诺贝尔物理学奖得主、素有“AI教父”之称的辛顿(Geoffrey Hinton)表示
2024-12-29 10:09:00
2025年央视春晚主创团队官宣:于蕾任总导演
快科技12月29日消息,距离2025年除夕还有30天,中央广播电视总台《2025年春节联欢晚会》正在紧锣密鼓筹备中。今日
2024-12-29 10:09:00