• 我的订阅
  • 头条热搜
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生图”四大核心功能上展...……更多
...学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地理学全谱系高质量语料...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中,「天工3.0」超越GPT-4V,全球领先。 (天工3.0多模态性能超越GPT-4V,全球领先) 同时,「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...型”“天工3.0”是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖端技术于一体的人工智能大模型。“超级模型”(Super Model)的概念诞生于“超级应用”(Super App)。互联网时代,超级应用是一种集成了多种...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...缺对文字背后的文化内涵以及家国情怀的理解。面对历史地理综合题时,模型并不能像人类考生一样有效识别学科属性。相较于简单的英语题,模型反而更擅长复杂的英语题。解理科题目时,模型会出现以超出年级知识范围外的...……更多
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet..……更多
马斯克 xAI 展示首个多模态模型 Grok-1.5V
...下旬推出 Grok-1.5 大语言模型之后,近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和照片中的内容。xAI ...……更多
杀疯了!1分钟完成100页PPT,天工AI人工智能速成法!
...工AI软件,自研4千亿级参数MoE混合专家模型【全球首个多模态“超级模型”(SuperModel)】。网页端tiangong.cn,app天工,小程序天工AI智能助手,任君挑选!该说不说,目前国内各类AI都是子chatGPT爆火后的跟风套壳,国内具备自研...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...AI搜索,相比New Bing搜索和谷歌AI搜索,它的最大特色是多模态搜索体验毫不逊色,可以在搜索结果中做到多步骤推理、图文并茂、图表生成以及非常精准的时效性,让我可以直接使用在内容创作中。 同时,天工AI还支持AI视频转...……更多
云知声推出山海多模态大模型:实时生成文本、音频和图像
IT之家 8 月 26 日消息,云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mistral 开源模型备受关注、谷歌 Gemini 即将应用于 Pixel Pro 和 Andr...……更多
...益课程内容,为居民提供了更加便捷的生活服务。它通过地理定位技术,让成都市民可以一键找到离自己最近的图书馆、健身房、影音室等公共设施。无论身在何处,只需打开小程序,即可轻松查找周边提供各类服务的群团分中...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
苹果发布新型开源人工智能模型:可根据自然语言指令编辑图像
...Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...中包含不可复现的论文。 CORE-Bench的优势能力要求高、多模态(Skills and modalities)解决CORE-Bench中的任务需要多种能力,包括理解指令、调试代码、检索以及跨学科解释结果,模型只有具备这些技能才能在CORE-Bench上拿到更高分数...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示,这意味着AGI实现将从10年缩短到1年。其实,Sora出现之前,也有其他类似的AI...……更多
全国首个 成都创新团队发布机器人多模态模型
中国首个机器人多模态模型,可以相对明确地将水果和非水果进行区分和分拣如果你想吃苹果,根据语音指令,机器人会把苹果送到你手上;如果想收拾干净桌面,机器人就会把桌上所有的东西归置好……这个关于人工智能描...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...其在传统学科知识上的深度(数学、物理、生物、化学、地理等顶级竞赛),还要在模型间的认知推理能力上展开较量。 近日,同样是研究团队,首次提出使用"奥林匹克竞赛奖牌榜"的方法,根据各AI模型在奥林匹克竞技场(各...……更多
李彦宏叫板GPT-4:百度“全家桶”AI化完成,10多款原生应用上线
...出整合后的答案。在呈现方式上,百度搜索还可以结合多模态能力,在数字、趋势相关的问题上,给出相应的动态图表。在解答后,百度搜索能推荐更为相关的一些问题。同时,百度在搜索过程中加入多轮交互的能力,用户可以...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...商合作,提供先进的机器人大脑产品。若愚科技的基于多模态大模型的通用机器人大脑研究主要聚焦在两个方向:一是负责感知层面的感知模型,二是控制层面的控制模型。感知模型通过语音交互、视觉信息传感器信号提取等方...……更多
百模大战又添新势力!李未可科技将发布自研AI大模型
...向生成式LLM大模型的进化,历时一年研发了自研的基于LBS地理位置信息的多模态交互大模型——WAKE-AI大模型,并于今年2月完成了国家网信办深度合成服务算法备案。虽然目前李未可并未透露过多关于WAKE-AI 大模型的相关信息,...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
更多关于科技的资讯:
数智羽翼赋能未来农业:牧族科技重塑300万羽蛋鸡产业新纪元
大众网记者 王帅 潍坊报道走进山东牧族的无抗蛋鸡生态养殖基地,偌大的鸡舍中鸡群正悠闲地散步、进食,却不见工作人员的身影
2025-07-22 20:11:00
潍坊昌邑优然牧业:数字赋能让牛舍“会思考”“会呼吸”
潍坊昌邑优然牧业:数字赋能打造“会思考”“会呼吸”的“科技牛舍”大众网记者 王帅 潍坊报道在科技浪潮重塑农业版图的当下
2025-07-22 20:15:00
先理知学:一站式服务,助力牙科学子申博圆梦
获取博士学位的意义在不同时代各有侧重,当下,其为个人搭起一座通往更高层次知识探索与开创的桥梁,同时对社会和行业发展亦影响深远
2025-07-22 21:08:00
先理知学:深耕申博套磁细节,以定制化服务学子
当下,越来越多的学生选择海外申博。但博士申请并非易事,在申请阶段,学子们常常会面临不同的挑战。加之申博时间紧,任务重的原因
2025-07-22 21:08:00
解读墨迹天气品牌焕新TVC:用“时间魔法”诠释“可预见的未来”
你是否也遇过这样的时刻:狂风撕扯着摄影师的镜头,雨帘撞碎了绿茵场的欢呼,阴云吞噬了期待的烟火,约会被突来的大雨打消……如果时光能倒流
2025-07-22 21:12:00
行业首创定义标杆典范,瑞幸生椰拿铁获2025消费大赏好物榜单权威认可
近日,瑞幸咖啡常青爆款生椰拿铁凭借其行业首创的标杆价值,以及卓越的市场表现和消费者口碑,成功入选南方都市报“2025消费大赏好物榜单”
2025-07-22 21:12:00
盈米基金与阿里云达成AI全栈战略合作
随着生成式人工智能的迅猛发展,财富管理领域的AI转型也迈入了“加速期”。7月21日,盈米基金与阿里云达成AI全栈战略合作
2025-07-22 21:12:00
一个工程师的极限挑战——专访山子有谦V17项目创业团队
在新能源汽车行业“反内卷”呼声高涨的当前,市场再次迎来有力竞争对手。日前,天猫与山子高科技股份有限公司(以下简称“山子高科”)签署战略合作协议
2025-07-22 21:12:00
迈入数字化时代,人工智能正以前所未有的速度重塑着各个行业的格局。2025年政府工作报告明确提出持续推进“人工智能+”行动
2025-07-22 21:12:00
深度智控出席工达科技“智汇多能·零碳未来”交流会暨生态伙伴答谢晚宴,并达成战略合作
2025年7月18日,“智汇多能·零碳未来”交流会暨工达科技生态伙伴答谢晚宴在济南百花汀国际酒店隆重举行。本次活动由济南工达捷能科技发展有限公司主办
2025-07-22 21:12:00
腾讯「附近的工作」落地河南,助力家门口就业更便捷
7月22日,腾讯出行服务联合河南省就业创业服务中心,正式上线“附近的工作”零工市场功能。求职者只需打开微信搜索“附近的工作”
2025-07-22 21:12:00
江南时报讯 7月19日,职业本科教育“AI+智启未来”“五金”建设交流会在南京举行。来自全国66所职业院校的代表参会,其中包含47所职业本科院校
2025-07-22 21:27:00
在经历2024年增速短暂下滑后,家用中央空调两联供市场在2025年上半年显现回暖迹象。最新数据显示,该细分领域H1实现1
2025-07-22 21:57:00
江南时报讯(记者 钱海盈) 近日,第二批文化和旅游部技术创新中心建设名单公布,由江苏省文旅厅推荐的交互式体感仿真游乐装备文化和旅游部技术创新中心和3D动漫制作工具链研发与服务文化和旅游部技术创新中心入选
2025-07-22 22:04:00
职教课堂比工厂还“工厂” 毕业=上岗 贵州练就市场抢手蓝领
在贵州装备制造职业学院,学生杨阳正专注地调试着一台数控机床的加工程序。金属碎屑在灯光下如微小的星辰迸溅,他稳定地操控着手柄
2025-07-22 22:47:00