• 我的订阅
  • 头条热搜
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式
...AIoT平台与DeepSeek等AI大模型融合,通过自然语言处理、多模态场景感知等前沿技术,推动设备向“主动智能”升级,从而为AI应用的落地开辟了新路径。 【宠物养护场景】 (图片由AI生成)此次,《全球智能商业》便将聚焦“宠...……更多
蔚来nomigpt端云多模态大模型上线,回答各种奇妙问题
...12日消息,今日,蔚来宣布为NOMI量身打造的NOMIGPT端云多模态大模型正式上线,新版本将陆续推送给搭载Banyan・榕智能系统的车型。得益于大模型支持,用户可以实现一句话设定AI场景,回答各种奇妙问题,与用户进行有情感的趣...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
基于多模态大模型和超大算力,车路云一体化进入3.0阶段
车路云一体化已经从1.0迈入到3.0新阶段,基于多模态大模型和超大算力,实现从数据获取、数据处理到数据分析的自动化、智能化升级,同时根据人类反馈进行强化学习,使数据更精准、质量更高,为解决自动驾驶“长尾问题...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...和案例大部分都是基于大语言模型。面向未来,他认为多模态大模型,抑或是文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI(通用人工智能)的必经之路。而百度在这些领域有着长期...……更多
阿里云通义大模型家族迎来新成员,通义万相已开启定向邀测
...云智能集团CTO周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。阿里云宣布AI绘画创作大模型通义万相开启定向邀测据介绍,通义万相在语义理解和图片生成上均表现优秀,首批上...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
这周,5家公司发了AI新品 | 最前线
...力,钉钉个人版对目前企业版进行了“瘦身”,在提供多模态交互的AI能力的同时,整合了wolai知识库、阿里云盘以及视频会议、通讯等基础功能。接入“通义千问”后,钉钉个人版对个人办公流程的最大改造之处,在于用敲入...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...千帆平台上线。据介绍,文心大模型4.5是百度首个原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1为深度思考模型,性能对标DeepSeek-R1,调...……更多
中科闻歌发布自研雅意大模型,支持离线、联网和私域部署|钛快讯
...领域知识问答、多语言内容理解、复杂场景信息抽取、多模态内容生成,共100多个特色技能,可快速对接政府、企业数据并一键生成大模型专属应用服务。该大模型可应用于媒体、金融、宣传、治理、安全等领域。中科闻歌董事...……更多
星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化
...目前各行业用户在落地广泛业务需求分析、处理多重数据模态对接、跟进高度定制场景问题解决、运营多源多框架AI模型等方面的问题,星环自主研发的一站式智能分析工具平台Sophon推出了3.2版本。3.2版本的Sophon通过以数据和模...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
大华股份:自研星汉大模型,推动智慧应用商业落地
...(002236)。事件:近日大华股份发布公告,公司发布了多模态融合的行业视觉大模型——大华星汉大模型,通过融合图像、点云、文本、语音等多模态数据,显著提升了视觉解析能力。点评:机器视觉垂类龙头厂商,业绩持续高...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...你也能化身法律专家。越来越多的从业者已经认识到,多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环,可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃,为未...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...Qwen-VL-Plus,与GPT-4V正面硬刚,这个有着SOTA级别性能的多模态大模型真正做到了“人无我有,人有我优”。继2023年4月的初级版本、2023年10月的LLaVA-1.5之后,2024年1月31日,微软研究院又联合威斯康星大学麦迪逊分校和哥伦比亚大...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
...征点的三维模型快速匹配系统高逼真数字人快速构建与多模态交互系统虚拟空间创作平台3D沉浸式实时通信系统3D实景地图平台基于文本描述的3D场景生成系统元宇宙数字身份标识技术解决方案人形机器人揭榜挂帅任务榜单:全身...……更多
视频应用或有惊喜!微软高管透露将于下周推出GPT-4
...亚斯·布劳恩透露,微软将在下周推出GPT-4,它是一个多模态模型,可以处理文本、图像、音频和视频。他表示,大型语言模型(LLM)已经适用于几乎所有语言,可以在一种语言中提出问题,然后在另一种语言中得到答案。[#zolspl...……更多
文博会观察:大模型为文化产业发展提供新机遇
...前来互动。“面向文化创作领域,腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示,面对内容制作行业多样化需求,腾讯混元在...……更多
更多关于科技的资讯:
智云(SCA生态发布会)圆满落幕 ——全球生态共振,开启智能新时代
【香港,2025年8月19日】由智云AI主办的SCA香港大会在香港盛大举行,并在热烈掌声和深度交流中圆满落幕。本次大会以“使命·品牌·生态”为主题
2025-08-23 13:05:00
不是不想买,是不会用!老年人买保险“数字鸿沟”谁来填?
“我爸今年60岁了,以前对保险没什么概念,这几年随着年龄增长、身体每况愈下,他开始意识到保障的重要性,可投保时犯了难,手机APP字太小
2025-08-22 08:08:00
●黄开典这个暑期,厦门文旅市场热度持续攀升。周杰伦、陈小春等歌手演唱会,乒超联赛等体育赛事陆续“登鹭”,一场场文体盛宴吸引全国各地的观众奔赴而来
2025-08-22 08:47:00
厦门网讯 (厦门日报记者 林露虹)国产钨钢钻头实现重大突破。近日,厦门麦达智能科技有限公司宣布,成功生产出直径仅0.009毫米(9微米)的钨钢钻头
2025-08-22 08:47:00
厦门网讯(厦门日报记者 陈泥)近日,市财政局联合市住房和建设局创新资产推介模式,首次在阿里巴巴资产交易和京东拍卖平台开展资产线上招商推介活动
2025-08-22 08:47:00
近日,中电鑫龙子公司安徽森源电器有限公司(以下简称“安徽森源”)再次凭借优质的产品性能与卓越的服务品质,签约河北瑞丰钢铁集团有限公司(以下简称 “瑞丰钢铁”)“145MW超临界煤气发电”及“170万吨焙烧机”两大关键工程
2025-08-22 09:13:00
现场网络流量激增167%!济宁移动全力保障“山东虾味鲜争霸赛”
大众网记者 刘迪 通讯员 吴广森 济宁报道8月14日至17日,“好客山东・美食争霸赛”第三场单品赛——“虾”路相逢・山东虾味鲜争霸赛在济宁市任城区津多里中心广场举办
2025-08-22 09:16:00
面对国内高端搬家市场日益增长的精细化服务需求,互联网搬家平台“蓝犀牛搬家”于近日宣布,对旗下的日式搬家服务进行重大升级
2025-08-22 09:19:00
新华社《半月谈》聚焦视源机器人:能巡逻、能巡检,四足机器狗已走进日常工作生活
你能想象一只机器狗在步行街巡逻、在变电站巡检、甚至还能帮你“上课”吗?这一切正在成为现实。近日,新华社《半月谈》专访视源股份高层段宇
2025-08-22 09:19:00
菏泽联通客户日:线上线下齐发力,暖心服务获赞无数
齐鲁晚报·齐鲁壹点 宋秋梅 通讯员 陈芳8月 19 日,菏泽联通客户日线下活动再度启程,10 个旗舰厅同步开展,通过提前邀约意向客户
2025-08-22 09:36:00
全省首次应用!十堰布设颗粒物通量激光雷达为空气做“CT扫描”
十堰广电讯(全媒体记者 赵向军 通讯员 叶相成 朱陈沁子)日前,在十堰市张湾区某小区楼顶,市生态环境局布设的一套球形三维扫描颗粒物通量激光雷达
2025-08-22 11:24:00
在方寸电站间磨砺出创新之刃
消费日报网讯(记者 冯举)在攀钢钒能源动力分公司热动专业区发电站,55MW发电机组冷风器冷油器在线反洗及串级节能操作法的成功应用
2025-08-22 11:44:00
从“谷子”到“痛金” IP赋能黄金产业年轻化发展
本报记者 卢 岳 □ 王琦琛根据世界黄金协会数据,2024年中国18岁至34岁消费者已成为黄金首饰消费的主力军。随着年轻人对黄金兴趣回归
2025-08-22 11:44:00
“演唱会+城市”叠加效应激发粉丝经济新活力
本报记者 卢 岳 □ 王琦琛今年夏天,北京仿佛化身为一座名为“MaydayLand”的城市主题公园。五月天“回到那一天”25周年巡回演唱会在鸟巢连开13场
2025-08-22 11:44:00
2025 年 7 月 21 日,聚焦计量检验检测一体化服务的数字化平台 —— 三测计量检测服务平台正式上线运营,该平台由深圳镎普检验技术有限公司主办
2025-08-22 12:21:00