通义,模型,尺寸,模型,训练,上下文头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...测基准上的领先表现；代码和数学能力显著提升；增大了上下文长度支持，最高达到 128K tokens（Qwen2-72B-Instruct）。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...款面向C端的大模型产品。早前，该公司宣布在大模型长上下文窗口技术上取得新的突破，Kimi已支持200万字超长无损上下文，并开启产品内测，该能力在不到半年内提升9倍。市场的火爆，导致Kimi服务器一度瘫痪，无法回复用户...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

阿里通义开源模型Qwen2.5力压Claude3.5、GPT

...Qwen2.5能够提供更为自然流畅的交互体验，这得益于其对上下文理解的深度把握以及对人类情感和意图的准确捕捉。可以说，在实现人机交互更加人性化方面，Qwen2.5迈出了坚实的一步。四、未来展望：探索未知的可能性最后，...……更多

2024-10-31 09:47:00通义,模型,阿里,顶级,模型,技术

AI“大姨”现场刁难智能客服！直击一群AI打PK赛，真能落地

...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法，并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。比如参赛选手云蝠智能，他们的主打业务是电话客服，在文本客服方面的积累不...……更多

2024-09-23 09:53:00大姨,一群,落地,智能,百炼,模型

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

本文转自：新华网12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI fo...……更多

2023-12-01 13:33:00通义,模态,模型,尺寸,参数,模型

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

时隔一个月，通义千问又放大招了！在一个月前的阿里云栖大会上，阿里正式发布通义千问2.0版本，在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上，都有较大提升。并且，阿里云还发布了包括编程、AI阅...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-7...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

阿里云：四川开发者可申领3600万tokens免费AI算力

...括通义千问GPT-4级主力模型Qwen-Long，该模型最高支持1000万上下文。“我们希望让更多四川企业、开发者享受到大模型带来的技术变革。”阿里云智能集团副总裁、公共云事业部西部大区总经理赵述刚表示。随着近期通义千问多款...……更多

2024-05-24 14:52:00阿里,四川,开发者,开发,通义,模型

阿里云推出“通义灵码”AI编程工具，支持VSCode、Jet

... / 函数级实时续写：在编码的过程中，该 AI 工具克根据上下文和当前语法，为用户自动预测和生成建议代码，用户只需单击 Tab 键即可采纳。自然语言生成代码：用户可在编辑器中，通过自然语言描述你想要的功能，根据描述和...……更多

2023-11-01 23:02:00通义,阿里,编程工具,主流,编程,支持

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...言模型）和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口，意味着模型的“记忆力”。据介绍，Yi目前拥有200K上下文窗口，可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到，由于GPU紧...……更多

2023-11-06 12:13:00李开复AI公司首发大模型，阿里云领投 | 36氪独家

真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几

...型，采用了阿里云首创的代码仓库知识图结构，支持 64K 上下文，具备跨文件感知、检索增强式生成（RAG）和自适应生成能力，研发问答准确率超过 90%。据统计，通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时，随...……更多

2024-09-21 09:38:00通义,阿里,程序员,进化,流程,程序

非Transformer架构站起来了!首个纯无注意力大模型,

...每个单词（或 token）与文本中的每个单词进行比较来理解上下文，它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源，模型推理速度就会变慢，超过一定长度的文本就没法处理了。...……更多

2024-08-14 09:39:00力大,架构,模型,模型,架构,训练

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

...Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万，API输入价格从0.02元/千tokens降至0.0005元/千tokens，降幅达到97%。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%至0.002元/千to……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本，可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一，对于理...……更多

2023-11-06 15:25:00阿里,万物,模型,评测,冠军,全球

AIGC工具测评：生成式AI的产品表现如何

...初代大型语言模型，ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而，最近的使用体验中发现模型在生成答案时偶有不稳定现象，可能与OpenAI目前的资源分配有关。不...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

阿里云CTO周靖人：全面投入升级AI大基建

...每个AI和应用提供高性能、高效的算力服务。大会现场，通义大模型迎来了年度重磅发布，基础模型升级，性能媲美GPT-4o，发布最强开源模型Qwen2.5系列，同时上架语言、音频、视觉等100多款全模态模型，通义开源模型累计下载量...……更多

2024-09-19 15:53:00阿里,基建,投入,升级,模型,通义

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

字节、阿里云、百度大模型价格混战：低价背后是数据竞争，爆款尚

...eek-V2“性能比肩GPT-4”，每百万token输入1元、输出2元（32K上下文），是GPT-4的近百分之一水平。在社交平台上，有认证为深度求索员工的用户表示，公司能够兼顾模型效果和成本，“基本纯靠模型结构创新（MLA+DeepSeekMoE）+ 超强In...……更多

2024-05-22 07:41:00阿里,字节,模型,尚未,背后,竞争

读懂大模型“拼应用”的内在逻辑

...英文，它仍能够做到梳理清楚主干的同时不失细节，结合上下文概括重点并回答用户提出的问题。更大的文本分析量也意味着支持更广泛的检索和归纳，提供更多的应用场景，为“用户检索+数据训练”的循环夯实基础。也要看...……更多

2024-03-26 07:21:00内在,逻辑,模型,应用,文生,人工智能

必然的命运：AI大模型冲向“免费轮盘赌”

...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5，并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着，要在愈发汹涌的人工智能市场上分得一杯羹，卷是宿命，也是必然。 02 鏖战，谁能破局向C端免费意味着大...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

to B要挣钱、to C要谨慎，李开复的大模型坚持

...解，Yi-Lightning是零一万物开发的Yi系列大语言模型，支持上下文16K，是零一万物最新高性能模型。根据内部评测数据，在8xH100 算力基础下，以同样的任务规模进行测试，Yi-Lightning 的首包（从接收到任务请求到系统开始输出响应...……更多

2024-10-17 09:58:00李开复,模型,模型,李开复,万物,时间差

国产大模型打响“价格战”

...Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%，至0.002元/千tokens。国内外厂商的GPT-4、Gemini1.5Pro、Claude3Sonnet及Er……更多

2024-05-23 02:54:00价格战,模型,国产,价格,模型,价格

Kimi爆火出圈，国产大模型首次超越海外！

2024年3月18日，国产AI大模型Kimi将上下文无损输入长度提升至200万字，成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识，从而更有针对性得与用户互动。在长...……更多

2024-04-02 18:31:00模型,国产,模型,上下文,能力,应用

腾讯混元文生图大模型升级并对外开源

...细粒度理解能力，混元DiT能够与用户进行多轮对话，根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型，支持中英文双语输入及理解，参数量15亿。运行该模型需要支持CUDA的英伟达GPU，单独运行混元...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

腾讯开源最大MoE大语言模型！3D大模型同时支持文/图生成，

...言模型，采用7T训练tokens，总参数量389B，激活参数量52B，上下文长度高达256K，技术报告也同步发布。混元-Large包括三款模型：Hunyuan-A52B-Pretrain，Hunyuan-A52B-Instruct和Hunyuan-A52B-FP8。与有相似激活参数量的业界开源……更多

2024-11-06 09:41:00模型,腾讯,全家,生成,同时,语言

阿里Q4财报：AI驱动新增长，阿里云AI相关收入三位数增长

...把握好增长机遇。”阿里巴巴集团首席执行官吴泳铭说。通义成为中国最强开源大模型，阿里AI商业化潜力显现AI为阿里带来全新的增长空间。本季度，阿里云完成面向AI时代产品策略调整，收入质量持续提升。在基础模型公司、...……更多

2024-05-15 18:17:00阿里,增长,位数,收入,驱动,阿里