• 我的订阅
  • 头条热搜
openai首席技术官:我们使用的是公开可用的数据和许可数据
...华尔街日报采访时却语焉不详,无法明确说明Sora的训练数据来源。在采访中,记者直接询问Murati关于Sora训练数据来源时,她仅以含糊的官方话术搪塞:“我们使用的是公开可用数据和许可数据。”当记者追问具体来源是否包含Y...……更多
...用ChatGPT补充得更完整。这个过程中产生了文本跟视频的数据集,数据集的质量、广度和体量都有明显提升。此外,Sora编码压缩也有所升级。“在新的技术架构升级下,Sora技术在文生视频领域迈了一大步,把参数量做大,而且具...……更多
微软研究人员正在测试其他ai模型
...乏事实依据”的内容,这意味着AI模型改变了它所给定的数据或添油加醋描述了原本不存在的信息。当然,AI幻觉这种东西也不是所有时候都毫无用处,例如当用户希望AI帮自己写一个科幻故事,或给出一种非传统想法时,就属于...……更多
美AI巨头被控秘密“侵吞”数据
...自:科技日报繁荣背后存隐忧美AI巨头被控秘密“侵吞”数据对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...分为4大维度,分别为普通图像、特定专业领域的图像、数据图像和手写图像。一、普通图像识别(1)内容较为单一的图像记者首先选取了一张波士顿动力机器人跨越障碍物的图像,内容较为简单,图上无文字,随后要求大模型...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...型在全球AI领域的重要进步。在MMLU、GSM8K、BBH、HellaSwag等数据集上,GLM-4的表现达到了94%至99%的水平。在HumanEval数据集上,GLM-4的得分为72分,超过了GPT-3.5和GPT-4。在中文指令跟随方面,GLM-4达到了GPT-4的88%至90%水平。此……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...生数科技3D生成效果。图源:生数科技 在3D等多模态训练数据稀缺的当下,据唐家渝介绍,生数科技多模态模型的训练数据主要来源于两块:互联网上大量公开的数据,通过向版权方购买的私有数据,两者共同完善训练数据的丰...……更多
OpenAI首席技术官:Sora将于年内正式向公众推出
...权限。当时,许多业内人士都在猜测Sora使用了哪些训练数据,以实现如此高的生成质量。在本次采访中,当被问到类似问题时,穆拉蒂回避了直接作答,只表示公司“使用了公开可用的数据和获得许可的数据”,并对记者的追...……更多
5项重大更新,NVIDIA助力人形机器人研发迈入新阶段
...A Isaac Lab 强化学习,从少量人类演示中学习,并根据视频数据生成机器人动作,对多模态指令的接受度非常可观。 同时,GR00T 模型使用的 Isaac 工具能够为在任何环境中的任意机器人创建新的基础模型。这些工具包括用于强化学...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...个因素:高效机器学习算法的创新、训练神经网络的大量数据的可用性,以及通过半导体技术的进步实现节能计算的进步。文章内容称,如果AI要以目前的速度发展下去,它将需要半导体产业做出更多贡献。10年内,它将需要1个1...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...成为热门话题以来,版权问题逐渐凸显。我们把复制训练数据的输出称为“抄袭输出”。此类输出的存在和特定诉讼结果很可能决定生成式AI的未来经济效益和社会影响。如何判定LLM的输出内容是否属于对训练内容的抄袭?这是...……更多
郑州第二十一届职工技术运动会人工智能训练师技能竞赛正式启动
...7月23日,由郑州市总工会主办,郑东新区总工会、中科大数据研究院承办的第二十一届职工技术运动会人工智能训练师技能竞赛在郑东新区智慧岛大厦正式启动。 郑州市总工会党组成员、副主席杜建新,郑州市人大常委会郑东...……更多
专访RepRisk首席执行官Philipp Aeby:企业应重视ESG风险指标披露,AI、大模型技术可辅助识别风险
...风险和机遇的信息。Philipp Aeby表示,作为一家研究ESG相关数据领域的企业,RepRisk的工作就是帮助用户、投资者、银行等,评估目标企业在ESG方面存在哪些潜在的风险,进行尽职调查。据悉,RepRisk成立于1998年,总部位于瑞士,利...……更多
微软被曝正自研AI大模型:5000亿个参数,与谷歌和OpenAI竞争
...下,MAI-1的规模要大得多,也需要更多的算力投入和训练数据。为了训练该模型,微软已经配置了大量包含英伟达GPU的服务器集群,并从各类来源收集训练数据,包括由OpenAI的GPT-4生成的文本和公共互联网数据。这或将使MAI-1与Ope...……更多
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...到谷歌本身,上述人士称,谷歌在投入了大量算力和训练数据,如来自网页的文本和图像后,并没有实现一些高管所期待的性能提升。当研究人员使用更多的数据和算力来训练模型时,过去版本的Gemini大模型改进速度更快。谷歌...……更多
OpenAI首席执行官奥特曼:电影将变成视频游戏
...拉蒂接受《华尔街日报》采访时,被问及OpenAI使用了什么数据训练视频生成模型Sora。穆拉蒂表示用的是“公开可用的数据”,随后被追问是否使用了YouTube、脸书、ins等社交平台的数据,她并未明确回答,反复强调使用的是“公...……更多
...所有可靠的英文文本资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括Open...……更多
破解AI耗电困局 科技巨头“押注”核能
...(Trenta),在其上进行的实验为商业聚变发展提供了关键数据。图片来源:Helion Energy公司官网【科技创新世界潮】◎本报记者 张佳欣近日,微软创始人比尔·盖茨透露,将继续对美国怀俄明州“下一代”核电站投资数十亿美元...……更多
恒生电子:金融大模型技术升级,国内AI芯片危机互现
...务”混合部署,基于场景驱动的金融垂直应用开发和积累数据资产、构建数据飞轮、提升应用成熟度等工作,实现金融行业大模型更好的应用落地。恒生电子首席科学家、大模型产品总监白硕介绍,此次升级的LightGPT,面向金融...……更多
新型脑机接口可将大脑信号转化为语音 准确率高达97%
...。这是因为解释大脑信号的机器学习程序需要大量时间和数据才能完成。\"以前的语音 BCI 系统经常出现单词错误。这使得用户难以被持续理解,成为沟通的障碍,\"布兰德曼解释道。\"我们的目标是开发一种系统,让人们在想说...……更多
硬科技热潮来了,落地却为什么迟缓?
...一亮的应用。我们反观美国的这些科技龙头公司,比如看数据,最近的ChatGPT,国内用不了,大家可能感受不到,但从最新的ChatGPT日活和周活数据看,最近的登录数据创历史新高,接近三四月的新高。所以只是大家觉得(大模型...……更多
本文转自:中国医药报分论坛7 真实世界数据研究与信息技术为真实世界研究提供技术支撑□ 本报记者 闫若瑜“真实世界研究的核心是真实世界数据(RWD)。如何收集高质量数据、高效率地采集数据,这些都需要信息技术的...……更多
Reddit首席运营官:就训练人工智能而言 公司的数据相当重要 【Reddit首席运营官:就训练人工智能而言 公司的数据相当重要】财联社3月22日电,Reddit首席运营官(COO)Jen Wong表示,随着人工智能的发展,该公司的数据许可业务将...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...人工智能系统包含传统许可未涵盖的元素,例如模型训练数据。现在,要使 AI 系统被视为真正的开源系统,它必须提供:可访问用于训练 AI 的数据的详细信息,以便其他人可以理解和重新创建; 用于构建和运行 AI 的完整代码...……更多
AI数据之战:大模型的“燃料”还能烧多久?
真实数据即将耗完,合成数据训练成替代品?作者/ IT时报记者 贾天荣编辑/ 王昕AI时代,高质量、规模庞大且安全可靠的语料库已成为构建强大AI模型的基石。近日有外媒报道,OpenAI使用所有公开可用的数据来训练ChatGPT,包...……更多
智启新元年:PC成为AI落地首选终端
...依然门槛较高。另一方面,当前的生成式AI均是基于公域数据进行训练,属于通用数据模型,还不够“量身定做”。对于企业来说,需要AI大模型能够贴合自身的生产实际创造真正的效益;对于个人来说,则希望大模型能够更加...……更多
OpenAI又放大招,一文看懂Sora对AI领域的影响
...作、电影剪辑、游戏设计等工作提升效率外,一个完全由数据驱动的数字世界或许已经近在咫尺。英伟达人工智能研究院首席科学家JimFan称“这是视频生成领域的GPT-3时刻”。360董事长周鸿祎称“Sora意味着AGI(通用人工智能)实...……更多
“美版贴吧”Reddit与OpenAI建立合作,股价涨11%
...20.11%。长期以来,Reddit内容一直是制作AI模型的热门训练数据来源。上周,Reddit发布了管理其数据使用的新政策。通过这一新政策,Reddit可以与人工智能开发商达成授权协议,从而为自己增加收入。 “我们的数据非常有价值,...……更多
ChatGPT一周年|炼制大模型芯片短缺数据有限,何以解忧?
...型下一步的进化方向是什么?AI芯片短缺何时解决?训练数据快要耗尽了吗?中国的百模之战会如何演化?AI技术发展应加速还是减速?。 算力与数据,是支撑大型语言模型发展的两大基础设施,类比发动机和燃料。生成式人工...……更多
Sora出现,手机行业将出现大洗牌?
...略,“1”代表OPPO AI超级智能体,能基于知识图谱、文档数据、搜索引擎,精准理解用户意图,给出准确结果。“N”代表基于OPPO AI Pro智能体开发平台所赋能的智能体生态,普通用户可通过零代码的自然语言交互,快速生成专属...……更多
更多关于科技的资讯:
高铁车厢的电源插座伤不伤手机,终于有答案了
原标题 | 小心!高铁车厢的电源插座,真的有点儿伤手机元旦一过,大学生的寒假和打工人的春节都不远了,一年一度的春运又要来了
2025-01-18 09:50:00
央媒看太原中国的消费品以旧换新政策在2025年继续实施。近日,中国国际电视台以《中国“以旧换新”政策继续提振消费活力》为题
2025-01-18 07:35:00
亏电油耗2.9L 续航破2000公里!吉利银河L6 EM-i预售:8.98万起
快科技1月18日消息,日前,吉利官方宣布,银河L6 EM-i正式开启预售,新车共推出5款车型,预售价区间为9.28-11
2025-01-18 07:57:00
河北日报讯(记者米彦泽)作为制造业大省,河北如何以数字技术赋能制造业高质量发展?1月14日,河北省政府办公厅印发《河北省数字技术赋能制造业高质量发展实施方案》提出
2025-01-18 07:58:00
国外评选为最具营养活力的蔬菜:90%的人没吃过
初冬到春末,如果你到南方的一些菜市场转转,会发现有一种蔬菜特别鲜嫩,绿油油的,十分诱人,它就是西洋菜。北方人可能第一次听过这种菜
2025-01-18 08:27:00
罗永浩要杀回手机行业了!为了AIOS
快科技1月18日消息,日前,有网友称自己陆续换了锤子T1、坚果R1、坚果R2,目前已经坚持不住了,锤子科技也不出手机了
2025-01-18 08:57:00
2024年净亏损6.19亿!龙芯加强研发:八核性能追上英特尔酷睿13
快科技1月18日消息,龙芯中科公布了业绩,预计2024 年年度实现营业收入5.06亿元左右,与上年同期基本持平;预计实现归属于母公司所有者的净利润为-6
2025-01-18 08:57:00
极越员工维权成功!工资和N+1赔偿已到账
快科技1月18日消息,据报道,此前因极越汽车原地解散,在职员工维权一事也迎来圆满结局。两名原极越汽车员工向媒体透露,1月17日已经收到工资和“N+1”补偿
2025-01-18 08:57:00
锚定AI+ 南京启动河西中央科创区建设
本文转自:人民网-江苏频道人民网记者 马晓波南京市建邺区产业科技创新大会暨河西中央科创区建设启动仪式。人民网记者 马晓波摄1月17日
2025-01-18 09:04:00
本文转自:人民网-北京频道人民网北京1月18日电 (记者李博)日前,2025北京数据交易成果报告会举行。会上集中发布了北京国际大数据交易所系列成果
2025-01-18 09:18:00
造谣“新能源车进不了海南”男子被行拘 涉案公司拟处20万罚款
快科技1月18日消息,据央视新闻报道,“一男子造谣新能源车彻底进不了海南被行拘”一事,迎来最新进展。海口市公安局副局长廖绪德表示
2025-01-18 09:27:00
南报网讯(记者李都)近日,位于南京江北新区的全国高校区域技术转移转化中心南京生物医药分中心传来好消息,东南大学顾忠泽教授团队的“器官芯片”项目拿到了江苏银行1000万元的授信支持
2025-01-18 09:33:00
本文转自:人民网-湖南频道人民网长沙1月18日电 (记者吴茜薇)无人机配送快递、植保无人机下田“干活”、无人机应急救援……如今
2025-01-18 09:43:00
本文转自:人民网人民网北京1月18日电 近日,中国五矿在京召开科技创新大会,正式发布了20项重大科技创新成果和13项“揭榜挂帅”重大攻关任务需求
2025-01-18 09:42:00
AMD Zen6将升级台积二代3nm工艺:2026年再见
这一代PC平台上,AMD、NVIDIA无论是处理器还是显卡,都停留在4nm级别,Intel的酷睿Ultra 200S系列虽然升级为3nm
2025-01-17 23:57:00