• 我的订阅
  • 头条热搜
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...Qwen2.5能够提供更为自然流畅的交互体验,这得益于其对上下文理解的深度把握以及对人类情感和意图的准确捕捉。可以说,在实现人机交互更加人性化方面,Qwen2.5迈出了坚实的一步。 四、未来展望:探索未知的可能性最后,...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。 比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿里云还发布了包括编程、AI阅...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
...的Qwen2.5-Turbo已在阿里云百炼上线,该模型支持100万超长上下文,相当于100万个英文单词或150万个汉字,在多个长文本评测集上的性能表现超越GPT-4。即日起,所有用户可在阿里云百炼调用Qwen2.5-TurboAPI,百万tokens仅需0.3元。全新...……更多
阿里云:四川开发者可申领3600万tokens免费AI算力
...括通义千问GPT-4级主力模型Qwen-Long,该模型最高支持1000万上下文。“我们希望让更多四川企业、开发者享受到大模型带来的技术变革。”阿里云智能集团副总裁、公共云事业部西部大区总经理赵述刚表示。随着近期通义千问多款...……更多
阿里云推出“通义灵码”AI编程工具,支持VSCode、JetBrains等主流IDE
... / 函数级实时续写:在编码的过程中,该 AI 工具克根据上下文和当前语法,为用户自动预测和生成建议代码,用户只需单击 Tab 键即可采纳。自然语言生成代码:用户可在编辑器中,通过自然语言描述你想要的功能,根据描述和...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...型,采用了阿里云首创的代码仓库知识图结构,支持 64K 上下文,具备跨文件感知、检索增强式生成(RAG)和自适应生成能力,研发问答准确率超过 90%。据统计,通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时,随...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千to……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
AIGC工具测评:生成式AI的产品表现如何
...初代大型语言模型,ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而,最近的使用体验中发现模型在生成答案时偶有不稳定现象,可能与OpenAI目前的资源分配有关。不...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...eek-V2“性能比肩GPT-4”,每百万token输入1元、输出2元(32K上下文),是GPT-4的近百分之一水平。在社交平台上,有认证为深度求索员工的用户表示,公司能够兼顾模型效果和成本,“基本纯靠模型结构创新(MLA+DeepSeekMoE)+ 超强In...……更多
...英文,它仍能够做到梳理清楚主干的同时不失细节,结合上下文概括重点并回答用户提出的问题。更大的文本分析量也意味着支持更广泛的检索和归纳,提供更多的应用场景,为“用户检索+数据训练”的循环夯实基础。也要看...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5,并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着,要在愈发汹涌的人工智能市场上分得一杯羹,卷是宿命,也是必然。 02 鏖战,谁能破局向C端免费意味着大...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
...解,Yi-Lightning是零一万物开发的Yi系列大语言模型,支持上下文16K,是零一万物最新高性能模型。根据内部评测数据,在8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包(从接收到任务请求到系统开始输出响应...……更多
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%,至0.002元/千tokens。国内外厂商的GPT-4、Gemini1.5Pro、Claude3Sonnet及Er……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
腾讯混元文生图大模型升级并对外开源
...细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。运行该模型需要支持CUDA的英伟达GPU,单独运行混元...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...言模型,采用7T训练tokens,总参数量389B,激活参数量52B,上下文长度高达256K,技术报告也同步发布。混元-Large包括三款模型:Hunyuan-A52B-Pretrain,Hunyuan-A52B-Instruct和Hunyuan-A52B-FP8。与有相似激活参数量的业界开源……更多
...把握好增长机遇。”阿里巴巴集团首席执行官吴泳铭说。通义成为中国最强开源大模型,阿里AI商业化潜力显现AI为阿里带来全新的增长空间。本季度,阿里云完成面向AI时代产品策略调整,收入质量持续提升。在基础模型公司、...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这...……更多
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来,双方将携手打造面向应用开发者和终端...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。 上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务上的分数。与其他模型进行比较时,除了MMLU分...……更多
更多关于科技的资讯:
2024年中国游戏产业年会:原生鸿蒙的新机遇、新体验、新服务
2024年度中国游戏产业年会于12月12日至13日北京市首钢国际会展中心举办,华为终端云全球生态发展与销售部副总裁张思建受邀出席主论坛
2025-01-07 10:59:00
2025年01月07日环洋市场咨询机构出版了一份详细的、综合性的调研分析报告【全球小信号分立器件行业总体规模、主要厂商及IPO上市调研报告
2025-01-07 11:01:00
青岛即墨:指尖上的“云平台”,数字赋能让就业服务精准高效
本文转自:人民网-山东频道2023年初,青岛市即墨区探索智慧城市建设的创新路径,开始搭建公共就业服务云平台。2024年8月
2025-01-07 11:05:00
本文转自:人民网-广西频道2024年,都安瑶族自治县积极推动数字基础设施、数字政府、数字经济、数字社会、数字安全建设,推动各领域数字化优化升级
2025-01-07 11:06:00
微星发布Intel B860 & H810主板,1.13开售
MSI微星发布专为Intel®B860和H810芯片组打造的系列主板。这些主板集性能与创新于一身,旨在为主流用户、玩家和创作者提供先进的计算能力
2025-01-07 11:09:00
李开复辟谣阿里收购:谣言散播的快 撤的也快
快科技1月7日消息,针对网络上流传的“阿里收购零一万物”的传闻,零一万物CEO李开复在朋友圈发文澄清:“不知为什么会有这样的谣言散播
2025-01-07 11:17:00
黄仁勋身着新皮衣亮相:手持RTX 5090闪耀全场!
快科技1月7消息,黄仁勋在CES的演讲,就像他的新皮衣一样引关注。2025 CES消费电子展(1月7日至10日,美国拉斯维加斯)开幕在即
2025-01-07 11:17:00
高管曾公开贬低中国电车 索尼本田新品牌AFEELA首车发布
快科技1月7日消息,在今日开幕的CES 2025消费电子展上,索尼与本田合力打造的电动车品牌AFEELA正式亮相, 并发布了首款量产车型 —— AFEELA 1
2025-01-07 11:17:00
本文转自:人民网-北京频道“小平台”撬动“大服务”超八成企业注册“北京市医疗器械审评咨询和预约系统”人民网北京1月7日电 (记者鲍聪颖)1月7日
2025-01-07 11:21:00
制药行业对低温冷水机情有独钟,其 “魅力密码”是什么?
在制药这个对环境条件和生产工艺要求近乎苛刻的行业里,低温冷水机宛如一位默默守护的得力助手,深受制药企业的青睐。究竟是什么独特的“魅力密码”
2025-01-07 11:21:00
中运科技与北京轻普出租汽车有限公司达成战略合作
近日,中运科技股份有限公司与北京轻普出租汽车有限公司签署战略合作协议,就数据业务场景共建、平台资源互惠及资本深度合作方面达成战略共识
2025-01-07 11:27:00
报告:春节“请2休11”拼假方案受用户追捧
1月6日,中国旅行社协会联合途牛发布《2025春节旅游消费趋势报告》(以下简称《报告》)。《报告》称,自2025年起,除夕纳入法定节假日
2025-01-07 11:28:00
“两颗芯”引爆显示革命 海信开启RGB-Mini LED新时代
北京时间 1 月 7 日凌晨,CES 2025展会开幕前,海信举办了2025显示技术发布会,全球首发RGB三维控色液晶显示技术
2025-01-07 11:34:00
重磅显示技术加持!海信将携116英寸全球最大Mini LED电视亮相CES
被誉为全球科技界奥斯卡的国际消费电子展(CES)将于1月7日在美国拉开帷幕,恰逢电视行业百年华诞,今年的CES备受关注
2025-01-07 11:36:00
杭州四小龙:闪耀的“东方神秘力量”
甲辰岁末,多家杭州公司顶着“东方神秘力量”的光环,密集被放到国内外的聚光灯下。一时间,“杭州四小龙”的说法在江湖上不胫而走
2025-01-07 11:42:00