• 我的订阅
  • 头条热搜
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。图源:VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...方面一直表现不佳,但他们一直在不断发展‘硬件 + 软件人工智能’堆栈,没有太多耀眼的广告。我认为,如果新的 iOS 版本突然让 OpenAI/Bard 聊天框看起来可笑地过时,他们可能会击败微软 /OpenAI 和谷歌。如果大量人工智能使用...……更多
微软推出全能型人工智能模型 Kosmos-1
...觉难题、执行视觉文本识别、通过视觉智商测试以及理解自然语言指令等等。从报道中获悉,Kosmos-1可以处理文本、音频、图像和视频等内容,构建一个全能型的人工智能,可以像人类思维一样来处理任务。研究人员在他们的学...……更多
meta推出全新ai图像生成器,可创建高分辨率图像
...的、独立的AI图像生成器——ImaginewithMeta,允许用户通过自然语言描述来创建图像。据介绍,新的人工图像生成器由Meta现有的Emu图像生成模型提供支持,可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用(后...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...多个细粒度原则进行标注,提供复杂精细化偏好标注。 自然语言语言反馈:提供细粒度批评和润色反馈,可利用此自然语言反馈开发算法及提升模型性能 跨模态 QA 对:输入输出包含混合模态,在不同模态之间实现更丰富的交...……更多
OpenAI推出GPT商店,人人可0代码自制智能体,业界看好成为下一个苹果
...上的一整套升级,为人们展现了一个未来:人人都能使用自然语言开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。人们不禁好奇,OpenAI是否会成为下一个苹果公司。“(...……更多
...模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声音等。一个智能系统如果能处理两种或两种以上的感知信...……更多
谷歌揭幕projectastra通用人工智能系统
...Dall-E3图像生成器方面的重要策略。谷歌声称,Veo具备对自然语言和视觉语义的深刻理解能力,能够按照用户的意愿创建任何所需的视频内容。这些AI生成的视频可以持续超过一分钟,并且Veo还能够理解电影制作和视觉技术的专业...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...I创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态...……更多
现场直击一文总结!OpenAI开发者大会,史上最强GPT-4 Turbo发布,AI圈地震
...OpenAI介绍,这种API是为了灵活性设计,用例范围包括基于自然语言的数据分析应用、编码助手、AI驱动的假期规划器、语音控制的 DJ、智能视觉画布。支持Assistants API的功能和新GPT产品的相同,都有自定义指令和一些工具,例如...……更多
最新美国国家人工智能科学院院士介绍
...国际人工智能领域的知名学者和专家,他们在机器学习、自然语言处理、计算机视觉、机器人技术、智能系统等方向具有深厚的学术背景和丰富的实践经验。这些成员通过参与科学院的研究项目、撰写学术论文、举办学术会议和...……更多
苹果大模型,不藏了
...模态理解能力,使得Ferret能够同时处理用户输入的图像和自然语言,并且由于其算法能够将图像中的元素准确拆分、定位,Ferret可以准确理解如“图片右上角”、“靠近沙发”这类指令。相比于卷疯了的自然语言处理,这种基于...……更多
人工智能已成风口:这款扫地机器人也要拥抱AI
...合如今的AI热潮,借助大语言模型可以让扫拖机器人听懂自然语言,从而交流起来更加方便,例如石头新近推出的自清洁扫拖机器人P20Pro就是一款内置大语言模型的扫拖机器人。想要实现模糊语音识别,就必须要求性能出色的大...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...级的图表理解、图像描述和视觉定位任务,比如直接根据自然语言描述定位图像中的事物。举个例子,用户可以提问:「去年哪个月的销售情况最好?」然后 Llama 3.2 可以根据可用图表进行推理并快速提供答案。至于轻量级的 1B ...……更多
苹果正式迈入人工智能时代,用户可通过Siri向ChatGPT提问
...VisionOS、iPadOS、iOS、MacOS、watchOS 等系统更新悉数亮相后,人工智能成为了压轴登场的主角。本次大会不仅揭晓了苹果在人工智能领域的最新布局,即“苹果智能(Apple Intelligence)”服务,还宣布与 OpenAI 达成合作,将 ChatGPT 深度...……更多
最强多模态模型GTP-4o问世,OpenAI继续开启人工智能创新之路
...大的亮点之一。该模型可以接受文本和图像输入,并生成自然语言、代码等文本输出。在给定文本和图像输入的情况下,GPT-4o能够迅速捕捉关键信息,进行深度分析和总结,为用户提供全面、准确的解答。 在图像理解方面,GPT-...……更多
...神经活动到语义信息。然后,结合大型语言模型多模态的自然语言处理能力,将语义信息转换为具体的操作或指令,为广泛的应用场景提供支持,包括智能家居、无障碍辅助、虚拟现实游戏以及人机交互等。灵羽助手:一款让AI...……更多
36氪研究院 | 2023年中国AI+游戏行业研究报告
...低数据需求量和训练时间,进而减少边际落地成本。随着自然语言大模型的逐渐成熟,其在游戏领域的商业化落地进度进一步提升。例如,Stable Diffusion可快速创建成场景、道具、武器等游戏资产;Ghostwriter可帮助研发人员设计游...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
封面新闻记者 马晓玉 边雪2022年底的人工智能的热潮是OpenAI的ChatGPT带来的,而2023年底,谷歌带着它的Gemini高调杀回人工智能圈。美国时间12月6日早间,谷歌发布了外界期待许久的大语言模型Gemini,在发布会现场,谷歌将Gemini的...……更多
昆仑万维发布国产版ChatGPT“天工” 今日启动邀请测试
...品“天工巧绘”后的又一款生成式AI产品。“天工”通过自然语言与用户进行问答式交互,AI生成能力可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等多元化需求。即日起,获得邀请的用户可在“天工”官网登陆...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...g up 显著推动了大语言模型(LLMs)研究的发展,展示了在自然语言处理(NLP)中推理和泛化能力的显著进步。为了理解多模态信息,多模态大语言模型(MLLMs)应运而生,赋予 LLMs 视觉指令跟随和场景理解的能力。受 MLLMs 在通用...……更多
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...RT2 为代表的第二代模型尝试整合 LLM 与视觉 Transformer,将自然语言与现实世界更紧密地结合起来。不过,即便如此在构建四维世界模型、有效预测未来行为、以及在复杂交互场景中进行灵活推理等方面仍然面临挑战。图丨谷歌 Pa...……更多
当生成式人工智能走向战场
...据间的关系。以ChatGPT为例,其模型架构是基于AI技术中的自然语言处理和深度学习技术生成,拥有1750亿参数,通过对巨量的数据集进行预训练,能够学习这些数据中的语言规则和模式。它还利用“人在回路”的方式进行了优化...……更多
...户的指令生成文本等内容。与传统软件不同,它能够解析自然语言命令,并在多种任务中表现出色,因而既用户友好又具有多样性。文章指出:“与大语言模型的互动看似非常简单:只需输入一个问题,立刻得到回答。然而,有...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...何随着模型大小、训练数据和计算资源的增加而变化。在人工智能研究的早期,训练模型往往需要在诸多超参数之间反复尝试,而 Scaling Law 提供了指导如何扩展这些参数的经验公式,使模型达到更好的性能‌。 Scaling Law 在 AI ...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...迅猛的助推剂,而其中的一股重要力量就是来自MetaMeta在人工智能开源界可谓是硕果颇丰,从大模型LLama到图像分割模型Segment Anything,覆盖了各种模态、各种场景,甚至在AI以外的学科,如医学等科学研究进展也都从Meta的开源模...……更多
...以,大语言模型之所以被称为叫通用人工智能,不光是在自然语言处理上发挥作用。它在计算机视觉,在自动驾驶等场景上都能有作用。将来,在蛋白质折叠分析,人类基因组序列分析等很多方面,我觉得大语言模型可能都会带...……更多
语音能力再突破!讯飞星火语音大模型即将发布
记者 刘阿龙人工智能快速发展催生语音合成技术不断成熟,让机器不仅能“开口说话”,还能“谈心交心”,在语音技术的突破下,人机交互将迎来新的发展阶段。1月30日,讯飞星火认知大模型V3.5升级发布会即将举行,会上将...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...或图像中物体检测及视觉定位。 三位一体,高效能打通自然语言、图像等多模态任务处理“书生2.5”在图文跨模态领域卓越的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合,即InternImage-G通用视觉大模型、用...……更多
...、公共支撑产品,这些产品涵盖了语音识别、图像识别、自然语言处理、机器学习、计算机视觉、知识图谱、数据挖掘等多个领域,覆盖了教育、医疗、金融、安防、交通、文化等多个行业,展示了成都在人工智能领域的创新实...……更多
更多关于科技的资讯:
开孔机盖+纯碳尾翼!小米SU7 Ultra“银色子弹”曝光
快科技2月13日消息,继官方公布的标志性黄色版本后,今日有博主曝光了银色版的实车视频。从视频来看,银色版采用淡雅的银色涂装
2025-02-13 17:50:00
腾讯元宝重大更新!接入Deepseek-R1满血版:免费用
快科技2月13日消息,今天腾讯官方宣布,其AI助手“腾讯元宝”迎来重大更新,正式接入满血版Deepseek-R1模型,用户打开腾讯元宝并进入对话界面
2025-02-13 17:50:00
自然成熟蜜 上海老字号森蜂园蜂蜜便宜了 2斤仅14.9元
森蜂园蜂蜜1kg平时要卖300.9元,今日下单可领246元限时优惠券,叠加满减优惠,到手仅14.9元。产品规格:自然成熟蜜
2025-02-13 17:50:00
威联通推出4盘位超扁NAS:可装4个HDD+3个SSD
快科技2月13日消息,威联通科技近日推出新款1U短机箱机架式4盘位NAS——TS-h765eU。其机身深度较短,可放置于小型媒体柜或壁挂式网络柜
2025-02-13 17:50:00
iPhone 17 Pro Max将首发金属超构透镜:灵动岛会变小
快科技2月13日消息,博主数码闲聊站爆料,iPhone 17 Pro Max会落地金属超构透镜,主要是集成Face ID Rx和Tx
2025-02-13 17:50:00
中国攻克世界级难题:高寒高海拔水电站大坝 没有一丝裂缝
快科技2月13日消息,在金沙江上,叶巴滩水电站正在如火如荼地建设中,这是一座举世瞩目的特高拱坝工程,叶巴滩水电站大坝至今未出现任何裂缝
2025-02-13 17:50:00
蔡崇信回忆初见马云:听他讲了大概一个小时 也不完全理解
快科技2月13日消息,据媒体报道,今日下午,在阿联酋迪拜举办的World Governments Summit 2025峰会上
2025-02-13 17:50:00
一转多+小夜灯:智能方形插座9.9元大促(USB款同价)
柱牛智能方形插座日常售价32.99元,今日下单领取23元优惠券,到手价9.99元。四种可选:二位五孔 + 二位二孔,2 个 USB-A + 1 个 USB-C 口
2025-02-13 17:50:00
马斯克父亲曝儿子为何买下推特:上不了官员会议桌 还被推特网友骂
快科技2月13日消息,据报道,马斯克的父亲埃罗尔·马斯克近日接受媒体采访时,谈到了马斯克要买下推特的原因。他表示,2021年底美国政府邀请了所有电动车厂商开会
2025-02-13 17:51:00
中国消费者报北京讯(记者孟刚)随着DeepSeek的爆火,其技术能力迅速被引入各个领域,近日,马蜂窝宣布其自研的AI智能应用正式接入DeepSeek大模型
2025-02-13 18:15:00
千万别点!iPhone新型电诈手段出现 苹果确认存在
快科技2月13日消息,近日,众多iPhone用户纷纷反映,他们收到了一则“重设密码”的弹窗提醒。当弹窗浮现时,其内容清晰地显示为
2025-02-13 18:21:00
谷歌前CEO:若再不行动 中国终将成为开源领域领导者
快科技2月13日消息,据媒体报道,谷歌前CEO埃里克·施密特(Eric Schmidt)在接受采访时指出,西方国家必须专注于打造开源AI模型
2025-02-13 18:21:00
男子住动物园酒店被熊猫咬 根本来不及躲 伤口触目惊心
快科技2月13日消息,据媒体报道,有网友发帖称江苏南通森林野生动物园,小熊猫进酒店客房咬伤游客,引起了广泛关注。据该游客发布的视频显示
2025-02-13 18:21:00
65万元春晚机器人一机难求:曾在春晚舞台大放异彩
快科技2月13日消息,据媒体报道,春晚因扭秧歌爆火的宇树科技人形机器人在京东平台开售。这次上架开售的机器人有两款,一是Unitree G1人形机器人
2025-02-13 18:21:00
辽BR7777劳斯莱斯幻影开拍:10分钟出价破400万
快科技2月13日消息,作为世界顶级豪车,劳斯莱斯幻影一直都有着非常强的市场需求,即便是二手车。在阿里资产平台上,一辆“辽BR7777”牌照的劳斯莱斯幻影正在拍卖中
2025-02-13 18:51:00