通义,模型,尺寸,模型,训练,上下文头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...测基准上的领先表现；代码和数学能力显著提升；增大了上下文长度支持，最高达到 128K tokens（Qwen2-72B-Instruct）。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多

2024-06-07 09:32:00通义,模型,尺寸,模型,训练,上下文

Kimi爆火背后：访问量仅次于文心一言和阿里通义，国内外大模

...款面向C端的大模型产品。早前，该公司宣布在大模型长上下文窗口技术上取得新的突破，Kimi已支持200万字超长无损上下文，并开启产品内测，该能力在不到半年内提升9倍。市场的火爆，导致Kimi服务器一度瘫痪，无法回复用户...……更多

2024-03-23 14:00:00卷上,通义,阿里,文心,下文,模型

720亿参数模型开源通义千问已实现“全尺寸、全模态”开源

本文转自：新华网12月1日，阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练，在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B，大中型企业可开发商业应用，高校、科研院所可开展AI fo...……更多

2023-12-01 13:33:00通义,模态,模型,尺寸,参数,模型

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

时隔一个月，通义千问又放大招了！在一个月前的阿里云栖大会上，阿里正式发布通义千问2.0版本，在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上，都有较大提升。并且，阿里云还发布了包括编程、AI阅...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

阿里云：四川开发者可申领3600万tokens免费AI算力

...括通义千问GPT-4级主力模型Qwen-Long，该模型最高支持1000万上下文。“我们希望让更多四川企业、开发者享受到大模型带来的技术变革。”阿里云智能集团副总裁、公共云事业部西部大区总经理赵述刚表示。随着近期通义千问多款...……更多

2024-05-24 14:52:00阿里,四川,开发者,开发,通义,模型

阿里云发布通义千问2.5，性能赶超GPT-4 Turbo

通义大模型发布一周年之际，迎来重要的历史性时刻。5月9日，阿里云正式发布通义千问2.5，模型性能全面赶超GPT-4 Turbo，成为地表最强中文大模型。同时，通义千问1100亿参数开源模型在多个基准测评收获最佳成绩，超越Llama-3-7...……更多

2024-05-09 12:00:00通义,阿里,性能,通义,模型,阿里

阿里云推出“通义灵码”AI编程工具，支持VSCode、Jet

... / 函数级实时续写：在编码的过程中，该 AI 工具克根据上下文和当前语法，为用户自动预测和生成建议代码，用户只需单击 Tab 键即可采纳。自然语言生成代码：用户可在编辑器中，通过自然语言描述你想要的功能，根据描述和...……更多

2023-11-01 23:02:00通义,阿里,编程工具,主流,编程,支持

钉钉宣布接入通义千问！

...，在对话框输入“/”即可自动整理群聊要点，快速了解上下文，并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。在聊天中，用户则可以训练专属的助理机器人。用户用“/”创建机器人后，只需要发送文档...……更多

2023-04-19 22:25:00通义,接入,生成,机器人,可生,对话

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...言模型）和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口，意味着模型的“记忆力”。据介绍，Yi目前拥有200K上下文窗口，可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到，由于GPU紧...……更多

2023-11-06 12:13:00李开复AI公司首发大模型，阿里云领投 | 36氪独家

阿里云通义千问主力模型价格直降97%，大模型商业化拐点已至

...Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万，API输入价格从0.02元/千tokens降至0.0005元/千tokens，降幅达到97%。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%至0.002元/千to……更多

2024-05-22 16:18:00通义,模型,阿里,拐点,主力,商业

零一万物大模型Yi-34B夺得全球开源评测“双料冠军”，已在

...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本，可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一，对于理...……更多

2023-11-06 15:25:00阿里,万物,模型,评测,冠军,全球

AIGC工具测评：生成式AI的产品表现如何

...初代大型语言模型，ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而，最近的使用体验中发现模型在生成答案时偶有不稳定现象，可能与OpenAI目前的资源分配有关。不...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

应用大模型飞书钉钉金山开卷

...框输入钉钉斜杠“/”即可自动整理群聊要点，快速了解上下文，并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。在聊天中，用户用“/”创建机器人后，只需要发送文档、网页或者知识库的一条链接，就可...……更多

2023-04-23 10:10:00书钉,金山,模型,应用,模型,应用

字节、阿里云、百度大模型价格混战：低价背后是数据竞争，爆款尚

...eek-V2“性能比肩GPT-4”，每百万token输入1元、输出2元（32K上下文），是GPT-4的近百分之一水平。在社交平台上，有认证为深度求索员工的用户表示，公司能够兼顾模型效果和成本，“基本纯靠模型结构创新（MLA+DeepSeekMoE）+ 超强In...……更多

2024-05-22 07:41:00阿里,字节,模型,尚未,背后,竞争

读懂大模型“拼应用”的内在逻辑

...英文，它仍能够做到梳理清楚主干的同时不失细节，结合上下文概括重点并回答用户提出的问题。更大的文本分析量也意味着支持更广泛的检索和归纳，提供更多的应用场景，为“用户检索+数据训练”的循环夯实基础。也要看...……更多

2024-03-26 07:21:00内在,逻辑,模型,应用,文生,人工智能

必然的命运：AI大模型冲向“免费轮盘赌”

...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5，并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着，要在愈发汹涌的人工智能市场上分得一杯羹，卷是宿命，也是必然。 02 鏖战，谁能破局向C端免费意味着大...……更多

2024-05-24 13:40:00轮盘,模型,必然,命运,模型,价格

Kimi爆火出圈，国产大模型首次超越海外！

2024年3月18日，国产AI大模型Kimi将上下文无损输入长度提升至200万字，成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识，从而更有针对性得与用户互动。在长...……更多

2024-04-02 18:31:00模型,国产,模型,上下文,能力,应用

国产大模型打响“价格战”

...Qwen-Long是通义千问的长文本增强版模型，性能对标GPT-4，上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens，Qwen-Long输出价格也直降90%，至0.002元/千tokens。国内外厂商的GPT-4、Gemini1.5Pro、Claude3Sonnet及Er……更多

2024-05-23 02:54:00价格战,模型,国产,价格,模型,价格