• 我的订阅
  • 头条热搜
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
阿里通义开源模型Qwen2.5力压Claude3.5、GPT-4o等顶级闭源模型
...Qwen2.5能够提供更为自然流畅的交互体验,这得益于其对上下文理解的深度把握以及对人类情感和意图的准确捕捉。可以说,在实现人机交互更加人性化方面,Qwen2.5迈出了坚实的一步。 四、未来展望:探索未知的可能性最后,...……更多
AI“大姨”现场刁难智能客服!直击一群AI打PK赛,真能落地的那种
...个满足现在用户需求的智能客服。能理解用户问题、结合上下文给出解决办法,并且有情商、说人话、能面对各种复杂情景。而且上手门槛很低。 比如参赛选手云蝠智能,他们的主打业务是电话客服,在文本客服方面的积累不...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿里云还发布了包括编程、AI阅...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
阿里云:四川开发者可申领3600万tokens免费AI算力
...括通义千问GPT-4级主力模型Qwen-Long,该模型最高支持1000万上下文。“我们希望让更多四川企业、开发者享受到大模型带来的技术变革。”阿里云智能集团副总裁、公共云事业部西部大区总经理赵述刚表示。随着近期通义千问多款...……更多
阿里云推出“通义灵码”AI编程工具,支持VSCode、JetBrains等主流IDE
... / 函数级实时续写:在编码的过程中,该 AI 工具克根据上下文和当前语法,为用户自动预测和生成建议代码,用户只需单击 Tab 键即可采纳。自然语言生成代码:用户可在编辑器中,通过自然语言描述你想要的功能,根据描述和...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几分钟
...型,采用了阿里云首创的代码仓库知识图结构,支持 64K 上下文,具备跨文件感知、检索增强式生成(RAG)和自适应生成能力,研发问答准确率超过 90%。据统计,通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时,随...……更多
非Transformer架构站起来了!首个纯无注意力大模型,超越Llama 3.1
...每个单词(或 token)与文本中的每个单词进行比较来理解上下文,它需要更多的计算能力和内存需求来处理不断增长的上下文窗口。但是如果不相应地扩展计算资源,模型推理速度就会变慢,超过一定长度的文本就没法处理了。...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千to……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
AIGC工具测评:生成式AI的产品表现如何
...初代大型语言模型,ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而,最近的使用体验中发现模型在生成答案时偶有不稳定现象,可能与OpenAI目前的资源分配有关。不...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instruct可胜任复杂推理任务,Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...eek-V2“性能比肩GPT-4”,每百万token输入1元、输出2元(32K上下文),是GPT-4的近百分之一水平。在社交平台上,有认证为深度求索员工的用户表示,公司能够兼顾模型效果和成本,“基本纯靠模型结构创新(MLA+DeepSeekMoE)+ 超强In...……更多
...英文,它仍能够做到梳理清楚主干的同时不失细节,结合上下文概括重点并回答用户提出的问题。更大的文本分析量也意味着支持更广泛的检索和归纳,提供更多的应用场景,为“用户检索+数据训练”的循环夯实基础。也要看...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5,并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着,要在愈发汹涌的人工智能市场上分得一杯羹,卷是宿命,也是必然。 02 鏖战,谁能破局向C端免费意味着大...……更多
to B要挣钱、to C要谨慎,李开复的大模型坚持
...解,Yi-Lightning是零一万物开发的Yi系列大语言模型,支持上下文16K,是零一万物最新高性能模型。根据内部评测数据,在8xH100 算力基础下,以同样的任务规模进行测试,Yi-Lightning 的首包(从接收到任务请求到系统开始输出响应...……更多
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%,至0.002元/千tokens。国内外厂商的GPT-4、Gemini1.5Pro、Claude3Sonnet及Er……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
腾讯混元文生图大模型升级并对外开源
...细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。运行该模型需要支持CUDA的英伟达GPU,单独运行混元...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...言模型,采用7T训练tokens,总参数量389B,激活参数量52B,上下文长度高达256K,技术报告也同步发布。混元-Large包括三款模型:Hunyuan-A52B-Pretrain,Hunyuan-A52B-Instruct和Hunyuan-A52B-FP8。与有相似激活参数量的业界开源……更多
...把握好增长机遇。”阿里巴巴集团首席执行官吴泳铭说。通义成为中国最强开源大模型,阿里AI商业化潜力显现AI为阿里带来全新的增长空间。本季度,阿里云完成面向AI时代产品策略调整,收入质量持续提升。在基础模型公司、...……更多
Mamba再次挑战霸主Transformer!首个通用Mamba开源大模型一鸣惊人
...有效地捕获其关系。这种通过比较文本中每个token来理解上下文的方式,需要更多的计算能力和内存来处理不断增长的上下文窗口。如果资源没有相应扩展,推理速度会变慢,最终无法处理超过某个固定长度的文本。为了解决这...……更多
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
...T的DCLM,DCLM-7B模型又进一步过滤出其中的2.5T用于训练。 上下文长度为2048,小于Mistral 7B和Gemma 2 9B的8k长度。性能方面,作者直接使用评估套件LLM Foundry,测试了模型在53个基准任务上的分数。与其他模型进行比较时,除了MMLU分...……更多
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来,双方将携手打造面向应用开发者和终端...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
更多关于科技的资讯:
【专家观点】中国人民大学新闻学院副院长王润泽:让新闻真实在技术加持下实现多维跃进
3月2日,贵州日报智媒创建启动仪式暨天眼新闻7.0创优版上线仪式在贵州饭店国际会议中心举行。现场,中国人民大学新闻学院副院长王润泽分享了在智媒时代
2025-03-02 22:47:00
这张照片 可以看到不一样的地球
这张照片中冒着绿色光辉的是地球——光辉是由大气气辉、极光,以及多云的太平洋上即将升起的太阳光组成。顶部那个像是黑暗中一道裂缝的部分是银河系——这与地球上的视角基本一样
2025-03-02 23:09:00
全国首个LNG绿色智算中心落址珠海:降低制冷耗能超50%
快科技3月2日消息,据报道,全国首个“LNG冷能综合利用+绿色智算中心”项目(以下简称“LNG绿色智算中心”)在珠海经济技术开发区管委会启动
2025-03-02 23:09:00
济南人工智能创新应用大赛复赛暨颁奖典礼成功举办
3月2日,一场聚焦智慧农业与大数据创新融合的AI赛事——“智算融合 智绘未来”济南人工智能创新应用大赛复赛暨颁奖典礼在数字济南体验馆成功举办
2025-03-02 23:11:00
鸿蒙智行:遭10多万条异常评论诋毁!奖励最高500万元征集线索
快科技3月2日消息,今晚,鸿蒙智能汽车技术生态联盟官方微博“鸿蒙智行发言人”发布了账号的第一条微博,称通过查证和部分网友提供的线索和证据
2025-03-02 23:39:00
助力3250家企业“走出去”,外贸“新春第一展”开幕
本文转自:人民网-上海频道人民网上海3月2日电 (记者龚莎)3月1日,外贸“新春第一展”——第33届华东进出口商品交易会(以下简称“华交会”)在上海新国际博览中心开幕
2025-03-02 19:52:00
167天的奇迹救援!发射失利的两颗中国探月卫星又活了
快科技3月2日消息,一般来说,卫星发射升空后如果遇到故障,想要救援几乎是不可能的,但是中国却创造了一个奇迹!2024年3月13日
2025-03-02 20:09:00
亚马逊首款量子芯片Ocelot发布:量子纠错成本降低90%
继谷歌、微软之后,亚马逊近日也发布了自家的第一代量子计算芯片 Ocelot,首次实现了可扩展的玻色子纠错架构,与目前的量子纠错方式相比成本可以降低超过90%
2025-03-02 20:39:00
生育率实在太低!韩国考虑每周只工作35小时
韩国的生育率一直都是全球最低,2023年韩国的生育率来到了历史最低水平,育龄女性的生育率只有0.72,这意味着每100个育龄女性只会生72个孩子
2025-03-02 20:39:00
比亚迪发布智能车载无人机系统“灵鸢”:全品牌车型可搭
快科技3月2日消息,今日晚间,比亚迪携手大疆在深圳举办智能车载无人机系统发布会,并将该系统正式定名为“灵鸢”。据介绍,“灵鸢”让汽车获得垂向视野
2025-03-02 21:09:00
江南时报讯 记者获悉,江苏首批32家标杆孵化器名单近日出炉。这些标杆孵化器涉及前沿新材料、生物医药、智能制造、绿色技术
2025-03-02 21:14:00
首搭灵鸢无人机系统!豹8无人机版上市:选配价16000元
快科技3月2日消息,比亚迪携手大疆在深圳举办智能车载无人机系统发布会,并将该系统正式定名为“灵鸢”。除已经上市的仰望U8(越野玩家版)外
2025-03-02 21:39:00
全国名字最长的火车站定了!史无前例的7个字
快科技3月2日消息,国铁集团近日正式发文,明确在建的京唐城际始发站正式名称为“北京城市副中心”站,一共7个字(不包含末尾的站字)
2025-03-02 21:39:00
我去试驾了小米SU7 Ultra:它真的想重新定义豪车!
万众期待的 SU7 Ultra 前天上市了, 52.99 万的价格直接把社媒引爆了。雷总之前还说目标一年卖一万辆,结果发布会当晚就完成了
2025-03-02 21:39:00
难以理解!为什么在自然界中 颜色鲜艳代表危险
大自然有自己的规则,鲜艳的颜色通常代表了危险信号,拥有鲜艳颜色的动物,它们很显眼,时刻在提醒潜在捕食者不要招惹自己。那么
2025-03-02 22:09:00