• 我的订阅
  • 头条热搜
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...方面一直表现不佳,但他们一直在不断发展‘硬件 + 软件人工智能’堆栈,没有太多耀眼的广告。我认为,如果新的 iOS 版本突然让 OpenAI/Bard 聊天框看起来可笑地过时,他们可能会击败微软 /OpenAI 和谷歌。如果大量人工智能使用...……更多
微软推出全能型人工智能模型 Kosmos-1
...觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。研究人员在他们的学...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...的、独立的AI图像生成器——ImaginewithMeta,允许用户通过自然语言描述来创建图像。据介绍,新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...上的一整套升级,为人们展现了一个未来:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。人们不禁好奇,OpenAI是否会成为下一个苹果公司。“(...……更多
...模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系统如果能处理两种或两种以上的感知信...……更多
谷歌揭幕projectastra通用人工智能系统
...Dall-E3图像生成器方面的重要策略。谷歌声称,Veo具备对自然语言和视觉语义的深刻理解能力,能够按照用户的意愿创建任何所需的视频内容。这些AI生成的视频可以持续超过一分钟,并且Veo还能够理解电影制作和视觉技术的专业...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...I创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...OpenAI介绍,这种API是为了灵活性设计,用例范围包括基于自然语言的数据分析应用、编码助手、AI驱动的假期规划器、语音控制的 DJ、智能视觉画布。支持Assistants API的功能和新GPT产品的相同,都有自定义指令和一些工具,例如...……更多
最新美国国家人工智能科学院院士介绍
...国际人工智能领域的知名学者和专家,他们在机器学习、自然语言处理、计算机视觉、机器人技术、智能系统等方向具有深厚的学术背景和丰富的实践经验。这些成员通过参与科学院的研究项目、撰写学术论文、举办学术会议和...……更多
苹果大模型,不藏了
...模态理解能力,使得Ferret能够同时处理用户输入的图像和自然语言,并且由于其算法能够将图像中的元素准确拆分、定位,Ferret可以准确理解如“图片右上角”、“靠近沙发”这类指令。相比于卷疯了的自然语言处理,这种基于...……更多
苹果正式迈入人工智能时代,用户可通过Siri向ChatGPT提问
...VisionOS、iPadOS、iOS、MacOS、watchOS 等系统更新悉数亮相后,人工智能成为了压轴登场的主角。本次大会不仅揭晓了苹果在人工智能领域的最新布局,即“苹果智能(Apple Intelligence)”服务,还宣布与 OpenAI 达成合作,将 ChatGPT 深度...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...大的亮点之一。该模型可以接受文本和图像输入,并生成自然语言、代码等文本输出。在给定文本和图像输入的情况下,GPT-4o能够迅速捕捉关键信息,进行深度分析和总结,为用户提供全面、准确的解答。 在图像理解方面,GPT-...……更多
...神经活动到语义信息。然后,结合大型语言模型多模态的自然语言处理能力,将语义信息转换为具体的操作或指令,为广泛的应用场景提供支持,包括智能家居、无障碍辅助、虚拟现实游戏以及人机交互等。灵羽助手:一款让AI...……更多
36氪研究院 | 2023年中国AI+游戏行业研究报告
...低数据需求量和训练时间,进而减少边际落地成本。随着自然语言大模型的逐渐成熟,其在游戏领域的商业化落地进度进一步提升。例如,Stable Diffusion可快速创建成场景、道具、武器等游戏资产;Ghostwriter可帮助研发人员设计游...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...品“天工巧绘”后的又一款生成式AI产品。“天工”通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。即日起,获得邀请的用户可在“天工”官网登陆...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...RT2 为代表的第二代模型尝试整合 LLM 与视觉 Transformer,将自然语言与现实世界更紧密地结合起来。不过,即便如此在构建四维世界模型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 Pa...……更多
当生成式人工智能走向战场
...据间的关系。以ChatGPT为例,其模型架构是基于AI技术中的自然语言处理和深度学习技术生成,拥有1750亿参数,通过对巨量的数据集进行预训练,能够学习这些数据中的语言规则和模式。它还利用“人在回路”的方式进行了优化...……更多
...户的指令生成文本等内容。与传统软件不同,它能够解析自然语言命令,并在多种任务中表现出色,因而既用户友好又具有多样性。文章指出:“与大语言模型的互动看似非常简单:只需输入一个问题,立刻得到回答。然而,有...……更多
语音能力再突破!讯飞星火语音大模型即将发布
记者 刘阿龙人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...或图像中物体检测及视觉定位。 三位一体,高效能打通自然语言、图像等多模态任务处理“书生2.5”在图文跨模态领域卓越的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合,即InternImage-G通用视觉大模型、用...……更多
...、公共支撑产品,这些产品涵盖了语音识别、图像识别、自然语言处理、机器学习、计算机视觉、知识图谱、数据挖掘等多个领域,覆盖了教育、医疗、金融、安防、交通、文化等多个行业,展示了成都在人工智能领域的创新实...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...,参数规模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出...……更多
AIGC工具测评:生成式AI的产品表现如何
...入了一个新阶段。相较于前代产品GPT-3.5,GPT-4不仅在处理自然语言方面取得了显著提升,而且在多语言处理能力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
2023内容科技应用典型案例:“央视听媒体大模型”发布
...一、案例概述2023年7月20日,中央广播电视总台联合上海人工智能实验室打造了“央视听媒体大模型”(以下简称“央视听大模型”),以海量视听数据和深度专业知识为驱动,利用原创先进算法和超大规模算力进行训练,赋能...……更多
两个人工智能系统说起“悄悄话”
本文转自:科技日报不依赖于预定义的命令或编程两个人工智能系统说起“悄悄话”两个AI系统实现相互对话,预示着AI系统将像人类一样进行互动交流。图片来源:slguardian.org科技日报北京3月24日电 (记者张佳欣)瑞士日内瓦...……更多
Sora“超级涌现力”将把AI引向何方
...的后续单词——就这样一个个接缀合成出句子,最终达到自然语言合成的目的。因此,OpenAI公司CEO山姆·阿尔特曼曾说:“预测下一个单词是通用人工智能(AGI)能力的关键。”那么,Transformer模型是如何被训练的?一般采用的...……更多
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座”研发团队介绍说,“双子座”是谷歌迄...……更多
更多关于科技的资讯:
近日,欧美地区开始流行“笨手机”的话题频登媒体热搜,并持续升温。与智能手机完全相反的是,“笨手机”是一种几乎只能打电话
2024-06-21 10:44:00
亿兰科125kw储能PCS系统,树立工商业储能领域新标杆
工商业储能正在迈向更激烈的产品力竞争期。华福证券《电力设备新能源行业周报》显示,储能电芯正沿着280Ah→300Ah+→500Ah+方向迭代
2024-06-21 10:45:00
智能厨电翘楚火星人集成灶 深耕科技创新 构建火星人未来家
在当今快节奏的生活旋律中,厨房已经演变成一个意义非凡的空间,它不仅仅是制作美食的场所,更是家庭情感交融的核心地带,是生活品质的直观映照
2024-06-21 10:45:00
英特尔笔记本CPU具有哪些产品优势?-泰盛国际
CPU是电脑的核心,对于笔记本来说,选择一款好的CPU至关重要。作为全球知名的芯片制造商,英特尔笔记本CPU在性能和稳定性方面一直备受好评
2024-06-21 10:46:00
英特尔笔记本CPU究竟有何过人之处?-泰盛国际
英特尔笔记本CPU,无疑是当今市场上的一颗璀璨明星,其光芒四射的性能、卓越的能耗控制以及稳定的运行表现,吸引了无数消费者的目光
2024-06-21 10:46:00
小米首款SUV曝光!网友纷纷晒法拉利对比图 :“法拉米”来了
快科技6月21日消息,日前,一组疑似小米第二款车型的路试谍照在微博上疯传,多位大V都进行了转发。虽然该车经过了重度伪装
2024-06-21 10:49:00
仅重55g!雷蛇炼狱蝰蛇V3极速版鼠标发布:支持26000DPI
快科技6月21日消息,雷蛇推出了新款游戏鼠标——雷蛇炼狱蝰蛇V3极速版,新款鼠标不但外形得到了优化,提供了非常自然的握感
2024-06-21 10:49:00
一加Ace 3 Pro纯白陶瓷真机渲染图公布:全新Ace标亮眼
快科技6月21日消息,一加已宣布将于6月27日发布全新的一加Ace 3 Pro,目前该机已在官网上架,并开启预约。根据官网放出的信息来看
2024-06-21 10:49:00
行业唯一!moto S50 Neo宣布提供4年质保:6月25日发布
快科技6月21日消息,联想将于6月25日召开新品发布会,推出摩托罗拉新款手机。其中除了此前预热的折叠屏外,还包括一款直板机moto S50 Neo
2024-06-21 10:49:00
安检进入AI时代,菜鸟自研高速智慧安检解决方案投入使用
近日,菜鸟高速智慧安检解决方案正式投入市场。该方案集成了物联网、人工智能以及大数据等技术,通过对安检机进行智能化改造,系统能够在运行速度达到每秒2米的高速安检机上
2024-06-21 10:55:00
济宁市民营企业:培育和发展新质生产力,以科技创新引领企业高质量发展
鲁网6月19日讯(记者 谢学刚 李莫然)6月19日,济宁市召开民营企业家记者见面会(第1场),山东广安车联科技股份有限公司董事长何兆广
2024-06-21 10:56:00
AI面试成热议焦点,人工智能再“聪明”,还是应处在辅助的位置
极目新闻评论员 文清蔓近年来,AI面试官逐渐走上人力资源管理的前台。在今年春招中,AI面试再次成为热议的焦点。不少求职者对AI面试的冰冷
2024-06-21 10:59:00
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
一水 发自 凹非寺量子位 | 公众号 QbitAI将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了
2024-06-21 11:01:00
左脑AI VS 右脑AI,哪个更聪明?
大脑分左右,分别负责不同的事情。AI是不是也是一样,有的擅长推理,有的擅长创造,只是大家的进度不一致而已。这篇文章,我们和作者一起来分析下这个问题
2024-06-21 11:01:00
数百款Intel CPU PC受影响!Phoenix UEFI固件被曝安全漏洞
快科技6月21日消息,近日,Phoenix SecureCore UEFI 固件被曝存在一个严重的安全漏洞,该漏洞被追踪编号为CVE-2024-0762
2024-06-21 11:04:00