• 我的订阅
  • 科技

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

类别:科技 发布时间:2024-12-04 09:51:00 来源:钛媒体APP
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

(图片来源:林志佳拍摄)

国内活跃度最高的AI大模型应用正走向“多元化”。

12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。

相比普通的OCR识别(光学字符识别)技术,豆包的“图片理解”并非识别文字,而是识别图片信息。比如,问一个景点在哪里,问动漫人物是谁,豆包都能流畅进行回答。

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

再比如,早前,马斯克创立的人工智能公司xAI宣布为Grok增加了图像理解功能,而马斯克本人也出来官宣了,并发布以下图片,称“Grok现在能够理解图像了,甚至还可以解释笑话”。

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

这是一幅四格漫画,内容是一个关于物理学家和牛顿的笑话。把这个四格漫画发给豆包,也能看到它对这个笑话的解析。

1. 第一格:文字:“HOW DO WE KNOW IF THEY'RE ACTUALLY DEAD OR JUST PRETENDING”(我们怎么知道他们是真的死了还是只是假装?)图像:两个人站在战场上,周围有许多倒地的士兵。

2. 第二格:文字:“PHYSICISTS”(物理学家),图像:两个人开始观察和思考。

3. 第三格:文字:“Discovered”(发现了),图像:两个人似乎有了某种发现,表情变得兴奋。

4. 第四格:文字:“Isaac Newton invented gravity”(艾萨克·牛顿发明了重力),图像:两个人得出结论,表情满意。

笑话解析:这个笑话讽刺了物理学家有时会提出一些看似荒谬但却基于科学理论的解释。漫画中的两个人在战场上看到士兵倒地,他们没有考虑士兵是死是活,而是思考这背后的科学原理。最后,他们得出结论是牛顿发明了重力,暗示士兵是因为重力而倒地。这种思维方式幽默地表现了物理学家对科学原理的执着和有时不切实际的思考方式。

你认为,上述这个解析结果怎么样?符合事实吗?

事实上,随着AI大模型狂飙两年,企业越来越多瞄向更实用的落地场景,“图片理解”就是其中一项,它可以解决一些搜索、查找评估、文本写作等场景的需求,这使得大模型更加贴近实用场景需求。

QuestMobile最新数据显示,2024年10月,AI原生应用行业月活跃用户规模达到8976万,同比增长373.0%。用于情感陪伴、职场办公、趣味休闲、文案写作、教育学习、生活助手、图像生成、行业顾问等场景中。

公开资料显示,字节跳动的豆包App已经成为中国日活用户最高的AI大模型产品。

同时,截止到2024年10月,在网页端访问量方面,Kimi智能助手、文心一言、豆包、通义千问分别达到2863万、2111万、1688万、1012万;在移动端AI原生应用方面,行业月活规模总数达到8976万,同比增长373%,其中,豆包、Kimi智能助手、文小言月活跃用户分别为4839万、1650万、1179万。

随着AI浪潮的兴起,各大厂商都在积极探索与AI大模型融合发展的新契机,AI有望引领全球新一轮科技创新周期,从而促使效率进一步增长。

据Statista数据显示,预计到2030年,全球AI领域规模将超过1.8万亿美元。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-04 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,
2024-12-18 17:35:00
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模
2024-09-30 09:51:00
豆包再降价,字节“饱和式”进攻仍在继续
...AGI更进一步,大家都在加速。实际上,字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日,据智能涌现报道,字节提升了即梦的产品优先级,尝试用新的路径打造AI时代的“
2024-12-20 09:25:00
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至
2024-09-24 18:15:00
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...做呢,月之暗面Kimi发布视觉思考模型k1;腾讯微信推出多模态大模型POINTS1.5;巨人网络发布千影有声游戏生成大模型,还有不胜枚举的初创公司带着自家模型的新进展试图刷个
2024-12-18 22:49:00
AI视频新战场:字节对决快手、反击Sora
...早。2023年8月,该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案,面向公众开放;字节跳动基础模
2024-09-30 13:34:00
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是
2024-05-15 16:16:00
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...用量超过 1.3 万亿,相比 5 月首次发布时增长超十倍,多模态数据处理量也分别达到每天 5000 万张图片和 85 万小时语音。尽管如此,模型性能掣肘成为了模型调用量进一步
2024-09-26 13:33:00
字节跳动发布豆包大模型 日均处理千亿级Tokens
...最佳效果和性价比。为此,豆包大模型提供的是一个有多模态能力的模型家族,目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。图:豆包
2024-05-15 11:30:00
更多关于科技的资讯:
见证首次无动力帆船环越南极,飞利浦鹅卵石Pro剃须刀以科技实力硬核护航,净护随行
2025年10月10日,人类首次帆船环航南极之旅于上海白莲泾旅游码头启航。由国家海洋公益形象大使、中国航海科普大使、中国环球航海第一人
2025-10-12 13:35:00
“电力工程号A星”今日出征
2025年10月12日,长光卫星技术股份有限公司在吉林省航天信息产业园举行“电力工程号A星”的出征仪式。公司及合作单位的领导和职工代表参加活动
2025-10-12 11:56:00
刷新多项世界纪录!我国新型单光子探测器量产落地
大皖新闻讯 日前,安徽省量子信息工程技术研究中心发布消息称,我国实现了全球首款四通道超低噪声半导体单光子探测器的量产落地(以下简称“深度制冷单光子探测器”)
2025-10-12 10:52:00
深入实施“人工智能+”行动丨浪潮智能终端“超高清+AI”解锁场景新玩法
漫步浩瀚太空,秒回侏罗纪时代,与科幻机甲同框……济南方特东方神画“九州神韵”的XR拍摄专区,小学生李安安兴奋地“穿越”在异时空中
2025-10-11 10:21:00
近日,据大象新闻报道,疾控卫监部门在一次突击检查中发现,某美容院将普通的高频电灼仪包装为“黄金微针”项目进行推广。这类看似创新的营销话术
2025-10-11 12:36:00
中新经纬10月11日电 (李自曼)近期,多家险企推出1年期的短期重疾险产品。同样保额下,传统重疾险保费动辄千元甚至上万元
2025-10-11 13:55:00
滨州移动织就“数字救援网”,赋能红十字演练通信零死角
鲁网10月11日讯近日,中国红十字应急救援北部协作区综合救援演练在山东省滨州市惠民县黄河三角洲应急消防实训基地拉开帷幕
2025-10-11 14:44:00
看点十足!2025中国移动全球合作伙伴大会变身“AI嘉年华”
当碳基生命的创造力与硅基生命的智慧力深度融合,将迸发出怎样的“AI+”可能?2025年10月10日—10月12日,中国移动全球合作伙伴大会在广州保利世贸博览馆盛大召开
2025-10-11 15:31:00
中国移动董事长杨杰:碳硅共生 合创AI+时代
10月10日至12日,2025中国移动全球合作伙伴大会在广州举行。10月11日上午,中国移动董事长杨杰出席大会主论坛,并发表题为《碳硅共生 合创AI+时代》的主旨演讲
2025-10-11 15:31:00
北京apm多重活动焕活国庆长假新体验,解锁假日新乐趣!
国庆假日期间,北京apm以“沉浸式假日体验”为核心,精心打造多元互动活动、热门IP联名快闪与专属会员福利矩阵,为王府井商圈注入鲜活动能与浓郁假日氛围
2025-10-11 15:41:00
山东乐陵:“老味道”飘出消费新滋味
位于乐陵市经济开发区的山东金鹏德盛斋扒鸡有限公司扒鸡生产车间内,老师傅王强不再像过去那样,紧盯着油炸锅、凭经验调节火力
2025-10-11 16:03:00
近日,张家口农商银行钟楼北小贷中心积极组织开展一场针对光大新天地商城内各商户的专项走访活动。此次活动旨在深入了解商城内各类商户的经营状况
2025-10-11 16:20:00
易生支付:智慧支付护航国庆文旅消费 赋能区域商业活力升级
2025年国庆长假期间,全国文旅消费市场持续呈现旺盛活力。易生支付凭借高并发交易处理、全渠道聚合支付、实时资金清算等核心技术能力
2025-10-11 17:08:00
齐鲁晚报·齐鲁壹点 连宁燕今年以来,威海市商务局围绕促消费开展了一系列卓有成效的工作。紧跟国家、省级、市级各级各类消费提振部署安排
2025-10-11 17:10:00
从精装到智装:百川装饰20年新范式在深圳启航
新范式·新百川·新未来:20周年发布品牌与战略升级近日,行业专家、合作伙伴及媒体代表逾300人齐聚深圳百川装饰集团20周年现场
2025-10-11 17:11:00