• 我的订阅
  • 科技

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

类别:科技 发布时间:2024-12-04 09:51:00 来源:钛媒体APP
刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

(图片来源:林志佳拍摄)

国内活跃度最高的AI大模型应用正走向“多元化”。

12月3日消息,钛媒体AGI获悉,字节跳动豆包日前上线了一项实用功能——图片理解。目前,豆包APP及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。

相比普通的OCR识别(光学字符识别)技术,豆包的“图片理解”并非识别文字,而是识别图片信息。比如,问一个景点在哪里,问动漫人物是谁,豆包都能流畅进行回答。

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

再比如,早前,马斯克创立的人工智能公司xAI宣布为Grok增加了图像理解功能,而马斯克本人也出来官宣了,并发布以下图片,称“Grok现在能够理解图像了,甚至还可以解释笑话”。

刚刚!字节跳动豆包上线图片理解,大模型走向多模态|钛媒体AGI

这是一幅四格漫画,内容是一个关于物理学家和牛顿的笑话。把这个四格漫画发给豆包,也能看到它对这个笑话的解析。

1. 第一格:文字:“HOW DO WE KNOW IF THEY'RE ACTUALLY DEAD OR JUST PRETENDING”(我们怎么知道他们是真的死了还是只是假装?)图像:两个人站在战场上,周围有许多倒地的士兵。

2. 第二格:文字:“PHYSICISTS”(物理学家),图像:两个人开始观察和思考。

3. 第三格:文字:“Discovered”(发现了),图像:两个人似乎有了某种发现,表情变得兴奋。

4. 第四格:文字:“Isaac Newton invented gravity”(艾萨克·牛顿发明了重力),图像:两个人得出结论,表情满意。

笑话解析:这个笑话讽刺了物理学家有时会提出一些看似荒谬但却基于科学理论的解释。漫画中的两个人在战场上看到士兵倒地,他们没有考虑士兵是死是活,而是思考这背后的科学原理。最后,他们得出结论是牛顿发明了重力,暗示士兵是因为重力而倒地。这种思维方式幽默地表现了物理学家对科学原理的执着和有时不切实际的思考方式。

你认为,上述这个解析结果怎么样?符合事实吗?

事实上,随着AI大模型狂飙两年,企业越来越多瞄向更实用的落地场景,“图片理解”就是其中一项,它可以解决一些搜索、查找评估、文本写作等场景的需求,这使得大模型更加贴近实用场景需求。

QuestMobile最新数据显示,2024年10月,AI原生应用行业月活跃用户规模达到8976万,同比增长373.0%。用于情感陪伴、职场办公、趣味休闲、文案写作、教育学习、生活助手、图像生成、行业顾问等场景中。

公开资料显示,字节跳动的豆包App已经成为中国日活用户最高的AI大模型产品。

同时,截止到2024年10月,在网页端访问量方面,Kimi智能助手、文心一言、豆包、通义千问分别达到2863万、2111万、1688万、1012万;在移动端AI原生应用方面,行业月活规模总数达到8976万,同比增长373%,其中,豆包、Kimi智能助手、文小言月活跃用户分别为4839万、1650万、1179万。

随着AI浪潮的兴起,各大厂商都在积极探索与AI大模型融合发展的新契机,AI有望引领全球新一轮科技创新周期,从而促使效率进一步增长。

据Statista数据显示,预计到2030年,全球AI领域规模将超过1.8万亿美元。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-04 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

字节跳动为企业提供极具性价比的多模态大模型能力
...正式发布豆包视觉理解模型,为企业提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%,
2024-12-18 17:35:00
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...个面向不同细分领域(视频生成、音乐和同声传译)的多模态大模型,同时给之前已有的通用语言模型、文生图模型、语音模型来了一波大升级。这些模型共同构建起了火山引擎的「豆包全模态大模
2024-09-30 09:51:00
豆包再降价,字节“饱和式”进攻仍在继续
...AGI更进一步,大家都在加速。实际上,字节对视觉化、多模态模型的重视度肉眼可见的提升。12月11日,据智能涌现报道,字节提升了即梦的产品优先级,尝试用新的路径打造AI时代的“
2024-12-20 09:25:00
豆包“王炸”:字节跳动一天发布两款视频生成大模型
...同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至
2024-09-24 18:15:00
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...做呢,月之暗面Kimi发布视觉思考模型k1;腾讯微信推出多模态大模型POINTS1.5;巨人网络发布千影有声游戏生成大模型,还有不胜枚举的初创公司带着自家模型的新进展试图刷个
2024-12-18 22:49:00
AI视频新战场:字节对决快手、反击Sora
...早。2023年8月,该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案,面向公众开放;字节跳动基础模
2024-09-30 13:34:00
字节跳动豆包大模型发布,火山引擎全栈AI服务助力企业智能化转型
...现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。人人用得起 才是好模型谭待认为,降低成本是
2024-05-15 16:16:00
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...用量超过 1.3 万亿,相比 5 月首次发布时增长超十倍,多模态数据处理量也分别达到每天 5000 万张图片和 85 万小时语音。尽管如此,模型性能掣肘成为了模型调用量进一步
2024-09-26 13:33:00
字节跳动发布豆包大模型 日均处理千亿级Tokens
...最佳效果和性价比。为此,豆包大模型提供的是一个有多模态能力的模型家族,目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。图:豆包
2024-05-15 11:30:00
更多关于科技的资讯:
中国蓝新闻讯 前不久,浙江省公布首批96家“科技新小龙”企业名单,涵盖新一代信息技术、生物医药、新材料等前沿领域。这些企业虽年轻
2026-01-08 20:27:00
中国蓝观察丨杭州也要造火箭!看商业航天在浙江开启新篇
中国蓝新闻讯 今天(1月7日),北京箭元科技有限责任公司(以下简称“箭元科技”)中大型液体运载火箭生产试验及总装总测基地正式落地浙江
2026-01-08 20:57:00
多彩贵州网讯鼠标轻点,数十公里外企业的用电异常数据实时呈现,以往需耗时多日现场排查的风险隐患,如今在几分钟内便可被系统自动识别与锁定
2026-01-08 21:59:00
江南时报讯 近年来,丹阳农商银行以“变中求进、守正创新”为主线,加快推进数字化转型,有力促进了数字金融协同发展,为普惠金融服务注入新动力
2026-01-08 22:32:00
合肥“机器人大学”新增“家庭课”:VR手把手教学,三个月“毕业”上岗
大皖新闻讯 家里乱了,谁来整理?这些日常家务,未来可能交给机器人。近日,合肥市具身智能机器人数据采集训练场在原有场景基础上
2026-01-08 18:05:00
三国何以“常青”?灵犀互娱发起游戏行业首个三国文化论坛
1月5日,中国游戏行业首个聚焦三国题材的文化论坛——“常青三国:重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办
2026-01-08 17:01:00
都匀佳速健诊所招新媒体运营 五险一金+弹性工作制
多彩贵州网讯(记者雷小露 裘金鉴) 为进一步扩大品牌影响力,推动科技医疗技术的广泛传播,都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名
2026-01-08 17:05:00
【宅男财经|专家面对面】中新经纬1月7日报道称,蔚来创始人、董事长李斌表示,汽车行业和AI行业都在抢铜、银等原材料,原材料涨价还没有传导到终端售价
2026-01-08 14:13:00
中新经纬1月8日电 (谢婧雯)8日,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股116.20港元。智谱开盘价报120港元/股
2026-01-08 14:13:00
记者昨日从中国科学院获悉,“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展,神舟二十一号航天员乘组共同在轨操作该项目实验
2026-01-08 15:08:00
上海晶珩ED-HMI3120:树莓派让工业控制可视化更简单
HMI3120工业人机界面是上海晶珩(EDATEC)最新推出的产品系列,内置树莓派CM5计算平台,融合了高性能处理能力
2026-01-08 15:23:00
26年深耕·千万青年共创:学院奖,链接青年力量与商业未来
当茅台王子酒的“王子音乐节”在高校掀起青春热潮,当可比克实践赛涌现出上千份青年创意实战方案,当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度
2026-01-08 15:25:00
确权破局护品牌,明远领航“大朴”启新程
随着国货家居品牌进入高质量发展阶段,维护品牌核心资产的唯一性已成为企业发展的重中之重。近日,家纺领军企业明远集团正式宣布
2026-01-08 15:26:00
百年守护 因AI而“声”动
2025年,故宫博物院迎来建院百年。 这一百年,是实物守护的百年——从战火中南迁万里护送国宝,到一代代匠人在红墙内对《五牛图》的精心修复
2026-01-08 16:39:00