• 我的订阅
  • 头条热搜
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...方面一直表现不佳,但他们一直在不断发展‘硬件 + 软件人工智能’堆栈,没有太多耀眼的广告。我认为,如果新的 iOS 版本突然让 OpenAI/Bard 聊天框看起来可笑地过时,他们可能会击败微软 /OpenAI 和谷歌。如果大量人工智能使用...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...的、独立的AI图像生成器——ImaginewithMeta,允许用户通过自然语言描述来创建图像。据介绍,新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...上的一整套升级,为人们展现了一个未来:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。人们不禁好奇,OpenAI是否会成为下一个苹果公司。“(...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...I创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...OpenAI介绍,这种API是为了灵活性设计,用例范围包括基于自然语言的数据分析应用、编码助手、AI驱动的假期规划器、语音控制的 DJ、智能视觉画布。支持Assistants API的功能和新GPT产品的相同,都有自定义指令和一些工具,例如...……更多
最新美国国家人工智能科学院院士介绍
...国际人工智能领域的知名学者和专家,他们在机器学习、自然语言处理、计算机视觉、机器人技术、智能系统等方向具有深厚的学术背景和丰富的实践经验。这些成员通过参与科学院的研究项目、撰写学术论文、举办学术会议和...……更多
苹果大模型,不藏了
...模态理解能力,使得Ferret能够同时处理用户输入的图像和自然语言,并且由于其算法能够将图像中的元素准确拆分、定位,Ferret可以准确理解如“图片右上角”、“靠近沙发”这类指令。相比于卷疯了的自然语言处理,这种基于...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...RT2 为代表的第二代模型尝试整合 LLM 与视觉 Transformer,将自然语言与现实世界更紧密地结合起来。不过,即便如此在构建四维世界模型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 Pa...……更多
当生成式人工智能走向战场
...据间的关系。以ChatGPT为例,其模型架构是基于AI技术中的自然语言处理和深度学习技术生成,拥有1750亿参数,通过对巨量的数据集进行预训练,能够学习这些数据中的语言规则和模式。它还利用“人在回路”的方式进行了优化...……更多
...户的指令生成文本等内容。与传统软件不同,它能够解析自然语言命令,并在多种任务中表现出色,因而既用户友好又具有多样性。文章指出:“与大语言模型的互动看似非常简单:只需输入一个问题,立刻得到回答。然而,有...……更多
语音能力再突破!讯飞星火语音大模型即将发布
记者 刘阿龙人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将...……更多
...、公共支撑产品,这些产品涵盖了语音识别、图像识别、自然语言处理、机器学习、计算机视觉、知识图谱、数据挖掘等多个领域,覆盖了教育、医疗、金融、安防、交通、文化等多个行业,展示了成都在人工智能领域的创新实...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...,参数规模有30亿、70亿、300亿三种大小,有图像识别和自然语言推理能力。其中,参与该论文的作者有30人,一半以上都是华人。 MM1测试效果不如Gemini和GPT4V和市面上其他大模型相比,MM1亮点并不在惊艳的效果上,也没有提出...……更多
AIGC工具测评:生成式AI的产品表现如何
...入了一个新阶段。相较于前代产品GPT-3.5,GPT-4不仅在处理自然语言方面取得了显著提升,而且在多语言处理能力上也有了重大突破。更值得一提的是,GPT-4引入了“多模态”功能,支持图像和语音输入,甚至可以输出图片,大大...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
人工智能(AI)巨头OpenAI又出王炸,其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉,其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍,Sora是一种扩散模型...……更多
2023内容科技应用典型案例:“央视听媒体大模型”发布
...一、案例概述2023年7月20日,中央广播电视总台联合上海人工智能实验室打造了“央视听媒体大模型”(以下简称“央视听大模型”),以海量视听数据和深度专业知识为驱动,利用原创先进算法和超大规模算力进行训练,赋能...……更多
两个人工智能系统说起“悄悄话”
本文转自:科技日报不依赖于预定义的命令或编程两个人工智能系统说起“悄悄话”两个AI系统实现相互对话,预示着AI系统将像人类一样进行互动交流。图片来源:slguardian.org科技日报北京3月24日电 (记者张佳欣)瑞士日内瓦...……更多
Sora“超级涌现力”将把AI引向何方
...的后续单词——就这样一个个接缀合成出句子,最终达到自然语言合成的目的。因此,OpenAI公司CEO山姆·阿尔特曼曾说:“预测下一个单词是通用人工智能(AGI)能力的关键。”那么,Transformer模型是如何被训练的?一般采用的...……更多
...谷歌公司6日宣布推出该公司“规模最大、功能最强”的人工智能模型“双子座(Gemini)”。谷歌旗下人工智能公司“深层思维”的首席执行官兼联合创始人德米斯·哈萨比斯代表“双子座”研发团队介绍说,“双子座”是谷歌迄...……更多
生成式大模型的远水,解不了智能手机厂商的近渴
...所展现出的远超过往人工智能应用的能力水平——无论是自然语言对话问答、知识总结、文稿编写乃至是程序编写、图像生成等,都可堪惊艳,在消费者可感知的领域产生了可成为真正生产力的感觉。 也正是基于ChatGPT所展显出...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...型Sora演示素材发布后,再次在全球范围引发了对生成式人工智能的迭代进化及内容生成能力的关注。它可以根据简单的文本指令生成长达60秒的高质量视频。这些视频不仅背景细致,还包含复杂的多角度镜头和富有情感的角色,...……更多
脚步不会停止,步步关乎高教
...软还将ChatGPT集成到其Bing搜索引擎中,这表明人工智能和自然语言处理在增强搜索功能方面越来越重要。这种集成旨在为用户提供更准确、更有相关性的搜索结果。 不过,此时高等教育领域已经认识到,ChatGPT的出现带来的并非...……更多
只用 13 天,OpenAI 做出了能听、能说、能自主决策的机器人大模型
...全与人类流畅对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。而其背后,就是 OpenAI 为其配置的智能大脑。在过去一年的具身智能进展中,或许你曾经看过类似的机器人自主...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...先行业以生成式AI为代表的的大模型技术是当下最前沿的人工智能技术,国内外科技巨头正积极布局各自大模型。2023年5月,国家标准委也正式启动了大模型标准化工作。而吉利早在2021年就已在AIGC相关技术领域进行研究和布局。...……更多
...。比如语言模型,当它只有几十亿数据时,只能解决原来自然语言处理中的一些问题,但当它超过5千亿数据时,基本上自然语言中所有的问题都迎刃而解,这就是规模的能力。大模型背后的核心到底是什么?张宏江认为是一个...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...)图表绘制:「天工3.0」全面提高了逻辑推理能力与用户自然语言Query的理解能力,使其能够更精准地判断用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。 (...……更多
Meta、斯坦福大学用生成式AI实现3D空间环境人机交互
...一个空场景的假设下操作。对于CHOIS,团队重点研究了从自然语言命令合成三维环境中人-物交互的关键问题,在语言和稀疏物体路径点的指导下生成物体运动和人体运动。运动应该与语言输入中指定的指令保持一致,同时符合由...……更多
让机器读懂你的情绪 重庆这个学生团队入围全国大赛50强
...大赛的作品叫“rainFriden--人脸情绪识别与星火认知大模型自然语言交互系统”,该项目于今年5月正式启动,并在讯飞人工智能学院第五届“AI暑期集结号”期间完成研发与调试,项目设计初衷是希望将大模型技术赋能于用户情绪...……更多
更多关于科技的资讯:
2024年11月18日调研机构GlobalInfoResearch出版了《全球纸张压花机行业总体规模、主要厂商及IPO上市调研报告
2024-11-18 16:27:00
造物数科受邀参加第三届数据治理年会 入选数据管理优秀案例
2024年11月17日,第三届数据治理年会暨博览会在北京隆重举行。此次盛会以“数字赋能迈向高质量发展”为主题,全面展示国内数据治理的最新成果
2024-11-18 16:29:00
11月15日,渤海银行股份有限公司(以下简称“渤海银行”)供应链金融产品——国内信用证全新面市,通过“三大变化”高效满足企业多场景交易需求
2024-11-18 16:33:00
华为Mate70系列预订火爆!预约人数已破百万,网友预测价格“参考上一代”
11月18日上午,余承东发布微博消息,官宣华为Mate品牌盛典将于11月26日14:30举行。值得注意的是,余承东此条微博是使用Mate 70 Pro+发布的
2024-11-18 16:37:00
华为余承东入驻微信视频号,为“史上最强Mate”预热
11 月 18 日,华为余承东现入驻微信视频号,认证为“华为常务董事、终端 BG 董事长、智能汽车解决方案 BU董事长”
2024-11-18 16:37:00
参展企业|临沂海德跨境电子商务有限公司
临沂海德跨境电子商务有限公司成立于 2019 年,位于临沂市兰山区双岭路与滨河路交汇临沂进口商品城兰华跨境电商产业园 1号馆 2 楼
2024-11-18 16:38:00
参展企业|谷道跨境电商孵化器(山东)有限公司
谷道跨境电商孵化器(山东)有限公司是一家位于淄博市张店区集外贸交易平台、外贸全流程服务、跨境贸易实训、人才孵化等服务于一体的外贸综合服务企业
2024-11-18 16:38:00
参展企业|山东特莱尔自动化科技有限公司
山东特莱尔自动化科技有限公司 , 屹立于激光与自动化技术的最前沿 , 专注于高端激光数控设备的研发、精密制造与全球销售
2024-11-18 16:39:00
参展企业|四叶草集团
四叶草集团成立于2022年1月,前身由四叶草直播产业基地、四叶草文化传媒、四叶草影视传媒、四叶草电子商务、四叶草食品、四叶草宠物食品以及众创星辰企业管理有限公司整合组建而成
2024-11-18 16:39:00
2024大湾区—东盟经济合作(前海)论坛 盛大开幕
前海湾畔,活力涌动。11月13日,2024大湾区—东盟经济合作(前海)论坛在深圳前海国际会议中心隆重开幕。本次论坛以“科技引领·产业共赢”为主题
2024-11-18 16:45:00
中国青少年电影周正式启动
2024中国电影金鸡百花电影节期间,由中国电影家协会、东南影都国际影视中心共同主办,中国儿童少年电影学会、华侨兄弟影业集团
2024-11-18 16:45:00
英菲尼迪败退中国
又一豪华品牌被曝退出中国。广州车展一片热闹之际,曾连续缺席的英菲尼迪被曝将停止国产。这已经不是英菲尼迪第一次被曝退出中国了
2024-11-18 16:53:00
贝佐斯前妻再捐80亿美元 累计已捐赠370亿美元
快科技11月18日消息,据报道,亚马逊创始人杰夫·贝佐斯前妻麦肯齐·斯科特最近出售了价值80亿美元的亚马逊股票,并用这笔钱帮助全美的慈善机构
2024-11-18 16:53:00
超美小直屏!OPPO Reno13外观赏析
“长得好看的,战斗力一般不会差”,这句话在网上很有名,如今更是几乎像公式一样,可以套用在任何产品上。而在手机圈,这样的描述同样贴切
2024-11-18 16:53:00
山东移动潍坊分公司:AI赋能智慧工地 打造数智守护下的安全高效施工场景
鲁网11月18日讯在尘土飞扬、机械轰鸣的临朐县嵩山生态旅游区山体工地上,工人们正紧张而有序地忙碌着。然而,与以往不同的是
2024-11-18 16:58:00