• 我的订阅
  • 头条热搜
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...中更多的细节。2、视觉编码器部分,支持混合图片/视频训练,提升压缩重建性能 视频生成模型中的视觉编码器,在压缩图片/视频数据,保留细节信息方面起着关键作用。混元团队自研了3D视觉编码器支持混合图片/视频训练,...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...每秒670亿亿次浮点运算),中心从投产即开始承接大模型训练任务,入选我国“2023年度央企十大超级工程”。大模型爆发为智算服务带来巨大的机遇和挑战,通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛,...……更多
首位AI科学家问世!已独立生成10篇学术论文,还顺手搞了AI审稿人
...。本研究探索了将强化学习应用于动态调整transformer模型训练中的学习率,使用验证损失和当前学习率作为状态,动态调整学习率以优化训练过程。结果在所有数据集上都优于基线模型,在训练时间上也表现出优势。第四篇,研...……更多
Sam Altman 2023首次中国演讲:十年内将出现超级人工智能,再呼吁AI监管国际合作 | 最前线
...模型,团队目前主要使用来自人类反馈的强化学习来进行训练。而从从GPT-4完成预训练到部署,OpenAI花费了超过8个月的时间来进行这项工作。为了提出更好的监督措施,Sam提到,OpenAI最近发表的几篇论文,就尝试搞明白大模型运...……更多
GPT-4震惊四座,中国创业者激战“小模型” | Future
...、有用户数据的小企业,已经基于国内外大模型的基座,训练出适配自身业务的小模型。而一家拥有百亿参数大模型储备的公司,也自行“瘦身”,针对金融、广告等领域,推出了轻量化的模型,以进行新一轮的数据储备。当下...……更多
京东:推动大模型加快落地应用  助力培育发展新质生产力
...发者可以更加专注于系统架构设计和关键程序开发……大模型行业应用前景广阔。根据《全球数字经济白皮书(2024年)》统计,目前,全球的人工智能大模型有1328个,中国的人工智能大模型达478个,约占全球数量的36%。在各类...……更多
前瞻2024人工智能四大趋势
据消息人士称,OpenAI正在训练下一代的人工智能,暂名“Q*”(读作Q-star)。新的一年,OpenAI下一代产品可能发布数据瓶颈指的是可用于训练AI的高质量数据的有限性,合成数据有望打破这一瓶颈。除了对大量高质量数据的需求...……更多
AIGC应用爆发,相关岗位需求增长超300%
...招人状态。招聘岗位涉及从底层算力、芯片设计,到模型训练、商业落地等多环节、全链条。招到一个生成式人工智能岗位的平均耗时是普通岗位的两倍。 不仅是科技类企业,生成式AI由于商业应用广泛,人才稀缺也蔓延到了...……更多
国内首个类chatgpt模型:复旦大学moss今日正式开源
...。MOSS基座语言模型在约七千亿中英文以及代码单词上预训练得到,后续经过对话指令微调、插件增强学习和人类偏好训练具备多轮对话能力及使用多种插件的能力。 MOSS来自复旦大学自然语言处理实验室的邱锡鹏教授团队,名...……更多
谷歌deepmind公布ai模型训练法
...消息,谷歌DeepMind日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。▲图源谷歌DeepMind(下同)据悉,FunSearch模型训练法...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...,但人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使 AI 系统被视为真正的开源系统,它必须提供:可访问用于训练 AI 的数据的详细信息,以便其他人可以理解和重新创建; 用于构建和运行 AI 的完整...……更多
...Ascend与鲲鹏部门首席运营官汪涛表示,Ascend 910B AI芯片在训练性能上已成功超越英伟达A100 AI GPU达20%,缩小了与英伟达 A100 的差。除此之外,腾讯控股和百度等中国领先企业也购买了Ascend 910B芯片,主要用于会议任务。华为将把小...……更多
把GPT-4接入《我的世界》,科学家正在发掘AI的新潜力
...实现的目标还是在游戏之外,研究人员表示通过这种方式训练语言模型,将来或许可以使许多日常办公任务自动化,或者根据使用者提出的需求来自动实现某些效果。不过虽然前景美好,该项实验依旧还停留在初期阶段,想真正...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...z/VCR (点击阅读原文即可直达,包含评用于模型评测和预训练的数据生成代码) Hugging Face 链接:huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务,研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图生视频」目标控制方法Moxin-7B:一个完全开源的大语言模型微软研究院:创建多用途、高质量 3D 资产智源推出视觉条件多视角扩散模型Turbo3D:超快速文本到 3D 生...……更多
...强大的基础模型,之后再结合场景开展与业务结合的相关训练。为此,亚马逊云科技与美国人工智能企业Anthropic开展合作,对Claude 3系列模型进行训练。当前,该模型在复杂任务中表现出优秀的理解能力。但仅有基础模型还远远...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...。回到谷歌本身,上述人士称,谷歌在投入了大量算力和训练数据,如来自网页的文本和图像后,并没有实现一些高管所期待的性能提升。当研究人员使用更多的数据和算力来训练模型时,过去版本的Gemini大模型改进速度更快。...……更多
ChatGPT能取代多少程序员?
...互能力极强,“它其实是用整个人类在互联网中的语调,训练成了一个大语言集合,可以想象它会开启一个使用自然语言和机器交互的新时代。”而作为曾经的技术人员,樊高也承认,⼤部分初级和重复劳动的工作都会被AI代劳...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...s & Insights from Multimodal LLM Pre-training》(MM1: 多模式LLM预训练的方法、分析和见解)中可以看到,MM1是一个图文的多模态大模型,参数规模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...tcome supervision)和过程监督(process supervision)两种方法在训练奖励模型上的效果。结果监督侧重于模型最终输出的正确性。而过程监督则关注模型在推理过程中每一步的正确性,能够指出答案中具体哪一步是错的:团队使用 GPT-4...……更多
人形机器人:通用之战和未解之题
...一到两年才能让人形机器人学会走路,现在利用 AI 算法训练一个月就可以实现。\" 传统人形机器人的训练算法,相当于是靠一些聪明的人类大脑去写一些数学方程式,然后去求解这个方程,制定机器人的运动轨迹。但这些方程...……更多
讯飞星火:致力于成为每个人的AI助手
...等痛点,iFlyCode2.0还可以提供企业定制优化工具,通过预训练和SFT训练,大幅提升代码推荐采纳率。AI有态度,“走出去”助力全球沟通无障碍今年杭州第19届亚运会举办期间,科大讯飞以讯飞翻译机深度服务亚运会。讯飞翻译机...……更多
谷歌绝地反击:新模型部分能力超GPT-4,Bard将支持中文,打响和微软AI之战
...对PaLM2进行了介绍。皮查伊称,PaLM 2接受了100多种语言的训练,因此它在语言理解、生成和翻译上的能力更强,并且会更加擅长常识推理、数学逻辑分析。据介绍,训练PaLM 2的海量论文和网页中包含了大量数学和科学数据集,比...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...求关系紧张是产生算力焦虑的根源所在。一方面,大模型训练与推理需求呈几何级数爆发——自2022年以来,人工智能算力需求每3~4个月就翻一番,每年训练AI模型所需算力增幅高达10倍,而生成式AI使上升曲线进一步陡峭,未来...……更多
Sora为何没能诞生在中国?
...员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆分成patch(视觉补丁,相当于token),然后直接输入模型学习。OpenAI官方介绍,Sora可以采样宽屏1920x1080p、垂直屏108...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...提供API接口的闭源经营理念不同,LLaVA1.6的代码、模型与训练数据全开源,且在标准评测数据集上跑出了较为亮眼的成绩。一、LLaVA1.6:卷上加卷LLaVA是一种端到端训练的大型多模态模型,又被称为“大型语言和视觉助手”。LLaVa-...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...破了 200+ stars!值得注意的是, LLM2CLIP 可以让完全用英文训练的 CLIP 模型,在中文检索任务中超越中文 CLIP。此外,LLM2CLIP 也能够在多模态大模型(如 LLaVA)的训练中显著提升复杂视觉推理的表现。代码与模型均已公开,欢迎访...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...,比如帮助学习任何棋盘游戏的规则、帮助教孩子数学、训练写作或是设计贴纸,还可以与他人分享这种自定义的GPT。用户无需编写代码就可以创建自己的GPT,就像开始对话一样简单,只需要给GPT指令和新的知识,然后选择它能...……更多
Nature:探秘世界最快超算 Frontier 的一天
...有 10 万张 H100 的 Colossus 集群,号称是世界上最强大的 AI 训练系统。而在这之前,截止到 2023 年 12 月,世界上运算速度最快的超算,是位于美国田纳西州橡树岭的 Frontier,也被称为 OLCF-5。Frontier 配备的是 AMD 的 CPU 和 GPU,有……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...新步伐基于腾讯混元的开源模型,开发者及企业无需从头训练,即可直接用于推理,并可基于腾讯混元系列打造专属应用及服务,能够节约大量人力及算力。同时,各大模型研发团队均可基于腾讯混元模型进行研究与创新,加速...……更多
更多关于科技的资讯:
富士胶片生命科学创新合作中心开放日圆满落幕
2025年2月21日,富士胶片(中国)投资有限公司生命科学事业部在其位于苏州医疗器械科技产业园的创新合作中心(Innovation &
2025-02-26 07:56:00
麦澜德打造行业领军企业
昨日,在江宁高新区麦澜德医疗科技公司内,工作人员正在生产女性盆底生殖康复诊疗设备。作为第八批全国制造业单项冠军企业,该公司专注于女性全生命周期物理技术干预整体方案研发及产业化
2025-02-26 07:57:00
宁企合作研发医疗信创自助机出院患者“零跑腿” “刷脸”就医更省心南报网讯(通讯员胡晓靓记者夏思宇)“您好,请正对屏幕‘刷脸’支付
2025-02-26 07:57:00
“雨花制造”销往50多个国家,外贸出口额占销售额40%——生产线奏响“春天序曲” “单项冠军”出海忙□南京日报/紫金山新闻记者肖凡 通讯员庄佳琪2月25日一早
2025-02-26 07:59:00
美国一机场险发生两机相撞:客机降落时一公务机突然横穿跑道
快科技2月26日消息,据央视报道,当地时间2月25日上午8点48分,美国西南航空公司2504号航班在芝加哥中途国际机场降落时
2025-02-26 08:04:00
京东承担骑手五险一金所有成本 专家分析每单外卖要贵:你真支持吗
快科技2月26日消息,之前京东发出公告称,目前外卖骑手的平均薪酬远低于京东快递小哥,为了薪酬公平性,未来一段时期签约的外卖全职骑手缴纳五险一金的所有成本
2025-02-26 08:04:00
DeepSeek开源周才第二天 有些公司就已经坐不住了
哥几个,走过路过别错过,今天的 AI 圈可以说是格外热闹了。真正 “Open” 的 DeepSeek ,打出开源周的第二发炮弹
2025-02-26 08:04:00
3899元起!小米有品众筹折叠键盘主机:插上屏幕就能用
快科技2月26日消息,小米有品众筹上线了口袋玲珑全尺寸折叠键盘多功能主机,是一款键盘形态的电脑,展开后尺寸为30×11×1
2025-02-26 08:04:00
2月24日小店区消息,该区打造的“数通小店”数字社区管理服务平台近日成功接入DeepSeek-R1大模型,实现人工智能深度赋能政务服务系统
2025-02-26 08:26:00
4950亿美元市值:腾讯坐稳中国互联网第一宝座!小米靠高端1年激增122%
快科技2月26日消息,依靠微信和诸多热门游戏等,腾讯依然是中国互联网的No.1。最新数据显示,腾讯成为2024年中国互联网企业市值冠军
2025-02-26 08:34:00
国内首款RAP主动式温控航空箱研发成功:可确保复杂环境下精准控温
快科技2月26日消息,据报道,中国国际海运集装箱(集团)股份有限公司成功研发出国内首款RAP主动式温控航空箱。长期以来
2025-02-26 08:34:00
极越车机APP现大量故障 车主担忧软件维护已无人负责
快科技2月26日消息,“极越无声-我们发声”公众号日前发文称,极越APP现系统故障,车主们质疑软件维护是否已无人负责。据介绍
2025-02-26 08:34:00
手机NFC碰一下就被盗刷视频系摆拍!支付宝:不解锁无法支付
快科技2月26日消息,前段时间,有网传视频称手机放兜里被人碰了一下钱就没了,但其实此视频是摆拍,造谣者已经被行拘。该事件近日登上了央视新闻
2025-02-26 08:34:00
曝特斯拉中国满血版FSD正测试验证中 美中工程师接力部署优化
快科技2月26日消息,据“晚点Auto”报道,特斯拉日前推送的软件更新,不同于美国版FSD功能,真正的“满血版”FSD还在测试优化中
2025-02-26 08:34:00
临沂市兰山区:三大提升行动 ,助力工业经济“开门红”
大众网记者 滕立军 通讯员 文胜爱 陈笑 临沂报道零部件空中智能投放、油液智能加注、产线装配自动化拧紧……2月24日,在位于临沂市兰山区的临工农机智能工厂
2025-02-26 08:54:00