• 我的订阅
  • 头条热搜
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多
Kimi爆火背后:访问量仅次于文心一言和阿里通义,国内外大模型都在卷上下文
...款面向C端的大模型产品。早前,该公司宣布在大模型长上下文窗口技术上取得新的突破,Kimi已支持200万字超长无损上下文,并开启产品内测,该能力在不到半年内提升9倍。市场的火爆,导致Kimi服务器一度瘫痪,无法回复用户...……更多
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型优异成绩。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI fo...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿里云还发布了包括编程、AI阅...……更多
阿里云:四川开发者可申领3600万tokens免费AI算力
...括通义千问GPT-4级主力模型Qwen-Long,该模型最高支持1000万上下文。“我们希望让更多四川企业、开发者享受到大模型带来的技术变革。”阿里云智能集团副总裁、公共云事业部西部大区总经理赵述刚表示。随着近期通义千问多款...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo,成为地表最强中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-7...……更多
阿里云推出“通义灵码”AI编程工具,支持VSCode、JetBrains等主流IDE
... / 函数级实时续写:在编码的过程中,该 AI 工具克根据上下文和当前语法,为用户自动预测和生成建议代码,用户只需单击 Tab 键即可采纳。自然语言生成代码:用户可在编辑器中,通过自然语言描述你想要的功能,根据描述和...……更多
钉钉宣布接入通义千问!
...,在对话框输入“/”即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。在聊天中,用户则可以训练专属的助理机器人。用户用“/”创建机器人后,只需要发送文档...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...言模型)和中文大模型榜单C-Eval排行榜已经爬升到1位。上下文窗口,意味着模型的“记忆力”。据介绍,Yi目前拥有200K上下文窗口,可处理约40万字的文本——这也是目前全球大模型中最长的上下文窗口。李开复提到,由于GPU紧...……更多
阿里云通义千问主力模型价格直降97%,大模型商业化拐点已至
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万,API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达到97%。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千to……更多
零一万物大模型Yi-34B夺得全球开源评测“双料冠军”,已在阿里云魔搭开源
...代码能力和数学能力专项的继续训练模型。全球最长200K上下文窗口Yi-34B模型将发布全球最长、可支持200K超上下文窗口(contextwindow)版本,可以处理约40万汉字超文本输入。上下文窗口是大模型综合运算能力的金指标之一,对于理...……更多
AIGC工具测评:生成式AI的产品表现如何
...初代大型语言模型,ChatGPT-4在专业知识获取、文案生成、上下文理解等方面表现出色。答案的完整性和连贯性同样值得称赞。然而,最近的使用体验中发现模型在生成答案时偶有不稳定现象,可能与OpenAI目前的资源分配有关。不...……更多
应用大模型 飞书钉钉金山开卷
...框输入钉钉斜杠“/”即可自动整理群聊要点,快速了解上下文,并生成待办、预约日程。还可以用“/”在群聊中创作文案、表情包等。在聊天中,用户用“/”创建机器人后,只需要发送文档、网页或者知识库的一条链接,就可...……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...eek-V2“性能比肩GPT-4”,每百万token输入1元、输出2元(32K上下文),是GPT-4的近百分之一水平。在社交平台上,有认证为深度求索员工的用户表示,公司能够兼顾模型效果和成本,“基本纯靠模型结构创新(MLA+DeepSeekMoE)+ 超强In...……更多
...英文,它仍能够做到梳理清楚主干的同时不失细节,结合上下文概括重点并回答用户提出的问题。更大的文本分析量也意味着支持更广泛的检索和归纳,提供更多的应用场景,为“用户检索+数据训练”的循环夯实基础。也要看...……更多
必然的命运:AI大模型冲向“免费轮盘赌”
...开发者大会上推出了0.0035美元/千tokens的Gemini Pro1.5,并将上下文长度拓展至200万tokens。国内外价格战的打响无不证明着,要在愈发汹涌的人工智能市场上分得一杯羹,卷是宿命,也是必然。 02 鏖战,谁能破局向C端免费意味着大...……更多
Kimi爆火出圈,国产大模型首次超越海外!
2024年3月18日,国产AI大模型Kimi将上下文无损输入长度提升至200万字,成为国内大模型首次在部分能力上超越海外主流产品的里程碑。上下文输入长度的增加能够帮助模型更好学习文本知识,从而更有针对性得与用户互动。在长...……更多
...Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%,至0.002元/千tokens。国内外厂商的GPT-4、Gemini1.5Pro、Claude3Sonnet及Er……更多
腾讯混元文生图大模型升级并对外开源
...细粒度理解能力,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。运行该模型需要支持CUDA的英伟达GPU,单独运行混元...……更多
...把握好增长机遇。”阿里巴巴集团首席执行官吴泳铭说。通义成为中国最强开源大模型,阿里AI商业化潜力显现AI为阿里带来全新的增长空间。本季度,阿里云完成面向AI时代产品策略调整,收入质量持续提升。在基础模型公司、...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
《红楼梦》里有大量东北方言?实测AI大模型“长文阅读”
...,国内通用人工智能“初创明星”月之暗面宣布在大模型上下文窗口技术上取得新突破,旗下的Kimi智能助手可支持200万字超长无损上下文,并开启产品内测,随即引发市场关注和热议,并一度因过于火爆“宕机”。随后,阿里...……更多
通义千问 再次“激活”阿里云
...勇,在阿里云峰会上正式发布了阿里的大语言模型工具「通义千问」,并宣布旗下阿里「全家桶」全部接入其中。发布会之前,通义千问的「鸟鸟」视频已经流传于社交媒体,而对于阿里来说,能娱乐大众是好事,但更重要的是...……更多
MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来,双方将携手打造面向应用开发者和终端...……更多
通义千问发布半年,大模型已不是阿里云唯一主角 | 焦点分析
...又无处不在。做AI时代的“电动机” 今年4月正式亮相的通义千问,是阿里云自研的底层通用大模型。半年过去,如今阿里云正式推出通义千问的2.0版本,参数已达千亿,在各项评测集中,其综合性能已经超过GPT-3.5,加速追赶GPT-...……更多
大模型时代的阿里云,将云计算进行到底
...时代最开放的云。”在现场,周靖人发布了千亿级参数的通义千问2.0,但更多的时间花在公布云计算基础能力的进展上:包括AI基础设施的全面升级、模型应用开发平台阿里云百炼以及更加自动化的云等,他宣布阿里云已初步建...……更多
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
出品|搜狐科技作者|汉雨棣10月31日云栖大会上,作为通义大模型基础模型的通义千问2.0千亿参数模型正式发布。与此同时,用户开始可以下载通义千问App进行体验。据了解,在10个权威测评中,通义千问2.0综合性能超过GPT-3.5...……更多
...节,做到准确上色。而且,AI模型还能理解色彩、光线和上下文,让上色更精准。”阿里巴巴集团公共事务资深总监王静介绍,AI技术正在让历史活化。在腾讯混元大模型展位,输入详细指令,几秒钟后,一张服装设计图便跃然...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...k。如今,马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。具体来说,首先,Grok-1.5 最明显的改进之一是其在代码和...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
更多关于科技的资讯:
复旦大学:黄亦玫严选 欢迎报考
6月26日消息,据国内多家媒体报道,近日,继清华玩梗“北京到底有谁在啊”之后,复旦也加入玩梗行列,打出“黄亦玫严选”的口号“招揽学生”
2024-06-26 13:37:00
有100万美元就算富裕人士!全球最贵城市前十名:中国香港位列第一
6月26日消息,在一份最新公布的《2024年城市生活成本报告》中,瑞士有四座城市入围“最昂贵城市”前十名。报告来源于世界知名人力资源管理咨询公司“美世”
2024-06-26 13:37:00
NO.1 新基因编辑工具SeekRNA面世澳大利亚悉尼大学生命与环境科学学院团队成功开发出一种比CRISPR更准确、更灵活的基因编辑工具SeekRNA
2024-06-26 13:31:00
女孩还没查分就收到北大电话:激动之情溢出屏幕
6月26日消息,据国内多家媒体报道,青岛女孩刘蓉高考成绩693分,语数英都是136分,总分排在全省前100名。她还没查成绩就接到了北京大学的电话
2024-06-26 13:52:00
来源:看看新闻Knews欧盟监管机构指控苹果公司违反了严格的新数字竞争规则,阻止应用开发者自由地引导消费者选择更便宜的服务
2024-06-26 13:53:00
比瓴科技荣获第三届横琴国际科技创新创业大赛潜力奖
今年,比瓴科技作为唯一一家网络安全公司在第三届横琴国际科技创新创业大赛中荣获初创组-潜力奖。大赛由横琴粤澳深度合作区执行委员会主办
2024-06-26 14:00:00
美国正在调查中国电信运营商
来源:俄罗斯卫星通讯社路透社援引消息人士的话报道称,拜登政府正在调查中国移动、中国电信和中国联通的行动。白宫担心,这些公司可能会通过在美国的云业务获取美国数据并将其提供给北京
2024-06-26 14:05:00
小米Civi 4 Pro迪士尼公主限定版手机开启预约:送联名礼盒、3CE彩妆
快科技6月26日消息,小米官方已经宣布,将于6月27日晚召开新品发布会,推出小米Civi 4 Pro迪士尼公主限定版。目前该机已经正式开启预约
2024-06-26 14:07:00
608元起、5年质保!华为消费级SSD终于来了:全国产打造
快科技6月26日消息,今年2月发布后,直到现在为坤灵eKitStor Xtreme 200 M.2固态硬盘才上架。这款消费级固态盘提供512GB
2024-06-26 14:07:00
墨西哥还值得新能源车企押注吗?|投资派
作者|耿宸斐编辑|宋婉心被中国新能源车企集体押注的墨西哥市场正在发生变化。从事中国-墨西哥段物流供应工作的Anitata告诉36氪
2024-06-26 14:07:00
“清凉神器”好用还是忽悠?
本文转自:北京晚报挂脖风扇升级为挂脖空调 冰凉坐垫加上了冰感科技“清凉神器”好用还是忽悠?今夏高温天气频频来袭,降温冰圈
2024-06-26 14:11:00
资源级买家连入10套?杭州商铺界的“躺赢”王者!
在2024这个充满不确定性的市场环境下,如何实现资产保值增值,是摆在所有投资者面前的问题,而龙湖•上城天街铂金岛的首开成绩却震惊了整个杭州商铺投资市场
2024-06-26 14:21:00
官方整活!清华告诉你北京到底有谁在:欢迎报考清华大学
6月26日消息,据国内多家媒体报道,近日,演员林更新在电视剧《玫瑰的故事》中的一句台词火出圈:“那你偏要去北京什么意思
2024-06-26 14:22:00
本文转自:中国新闻网中新网上海6月26日电 (郑莹莹 马帅莎 缪新培)嫦娥六号探测器25日结束为期50多天的旅途,从38万公里外的月球背面“挖土”回来
2024-06-26 14:25:00
长沙经开区数智化转型发展新产业
本文转自:中国新闻网中新网长沙6月26日电 (记者 唐小晴)湖南维胜科技有限公司是长沙经开区一家主营柔性印制电路板生产及元器件组装的企业
2024-06-26 14:25:00