• 我的订阅
  • 头条热搜
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...这个金秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商...……更多
DeepSeek R1赋能爱尔眼科“爱科(Eyecho)”数字人 驱动智慧医疗新突破
...。术后陪伴数字人:通过手机端提供视频、语音及文本多模态服务,为术后患者定制个性化康复方案,实现长期眼健康管理。自发布以来,爱尔数字人“爱科(Eyecho)”已在集团总部及旗下多家医院投入使用,并亮相多个国际国内...……更多
“AI孙悟空”对话全球!讯飞星火AI大模型展项亮相大阪世博会
...语种、高噪场景语音识别、多情感超拟人语音合成以及多模态交互等技术能力,为全球游客提供幽默问答和智慧导览,成为中国馆唯一大模型展项。大阪世博会中国馆“孙悟空”遇上自主可控AI大模型:让中国文化“活”起来“...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
谷歌大模型Gemini视频被质疑造假、夸大宣传,官方回应:演示内容有剪辑|钛媒体焦点
...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而,有多个消息称,这段制作的演示视频夸大了Gemini技术能力,被质疑造假、夸大宣传等,实际上手时发现Gemini并不能达到视频中的效果。同时,这类营...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模型技术增长没有放缓的趋势,Scal...……更多
一脉阳光与讯飞医疗达成战略合作:驱动医疗AI深度落地
...5万家基层医疗机构,其医疗大模型已在诊断准确率、多模态数据处理等领域建立技术壁垒。公司于2024年12月在香港上市,成为医疗大模型第一股。此次合作的深层背景,是当前中国医疗体系中基层医疗建设的工作重点。2024年6月...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
谷歌chrome地址栏整合gemini聊天机器人
...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态,具备跨模态推理能力,包括文本,图像,视频,音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大,适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多
谷歌最强小屏旗舰!谷歌Pixel 9发布:5700元起
...器,这是谷歌团队定制的一颗旗舰芯片,是谷歌首款以多模态运行Gemini Nano的处理器。 官方介绍,对多模态的支持意味着谷歌Pixel 9系列不仅可以理解文本,还能理解图像、音频和语音。其它参数方面,谷歌Pixel 9前置1050像素,...……更多
腾讯版Sora发布即开源!130亿参数,模型权重、推理代码全开放
...成模型还有三个亮点。1、文本编码器部分,已经适配多模态大模型当下行业中多数视觉生成模型的文本编码器,适配的主要是上一代语言模型,如OpenAI的CLIP和谷歌T5及各种变种。腾讯在开源图像生成模型Hunyuan-DiT中适配的是T5和C...……更多
涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式
...AIoT平台与DeepSeek等AI大模型融合,通过自然语言处理、多模态场景感知等前沿技术,推动设备向“主动智能”升级,从而为AI应用的落地开辟了新路径。 【宠物养护场景】 (图片由AI生成)此次,《全球智能商业》便将聚焦“宠...……更多
澳鹏全新推出一站式文档智能识别解决方案
...方便对其中数据作进一步利用。接口支持识别文档中不同模态的数据,如文本、插图、公式、表格等,并支持对不同版面进行识别和还原。澳鹏一站式文档智能识别解决方案集成了多种算法能力:首先使用版面识别算法,可识别...……更多
ocr图片识别技术在智慧城市建设中的应用
...用将不断深入,提高字符识别的准确率和效率。(二)多模态数据融合OCR技术将与其他传感器技术相结合,实现多模态数据的融合,提高城市管理的智能化水平。(三)云计算技术的应用OCR技术将与云计算技术相结合,实现数据...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...阿里云也首次开源了音频理解大模型Qwen-Audio,这是在多模态领域的一次探索。Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
星火大模型v3.5发布,带来七大能力提升
...为教师的“AI助手”。据官方介绍,星火智慧黑板具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享等特性。其内置“板书同步模式”,教师使用粉笔在智慧黑板旁边的传统黑板上书写时,板书内容可以同步...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证 【盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电,盛视科技在互动平台表示,公司基于多...……更多
数坤科技打造全链路多模态智能卒中方案,引领医疗健康产业创新发展
...为卒中领域的发展带来了崭新的机遇。通过打造全链路多模态智能卒中方案,数坤科技引领卒中诊疗进入新时代。数坤科技智能卒中方案:全链路多模态助力卒中,作为全球范围内最为常见且危险的脑血管疾病之一,每年都在给无数...……更多
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
WOT全球技术创新大会2024北京站:探索AI 的无限可能
...里巴巴、Fabarta、商汤科技的三位老师带来精彩分享。多模态AIGC前沿探索专题竞技世界在直播亮点和舆情感知两个真实场景中,如何使用多模态AIGC在实际应用中获取价值?万物云如何通过结合文本和图像输入,利用AI算法自动生...……更多
未来医院变形记:生成式AI将病历书写从8小时缩短至25分钟
...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术,老年患者通过文本或语音与AI陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。第二,服务流程复杂,患者晕头转向。就医过程中,...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
中信证券:谷歌Gemini模型发布 AI进入多模态时代 【中信证券:谷歌Gemini模型发布 AI进入多模态时代】财联社12月7日电,中信证券研报指出,近日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemi...……更多
恒生科技30ETF上涨2.08%,恒生科技指数强势走高
...超2%,苹果、谷歌涨超1%。国元证券指出,技术面上AI在多模态领域持续发展,9月底Meta、OpenAI陆续发布多模态版Llama2(AnyMAL)、GPT-4V,进一步推动AI在多模态领域持续进步和应用持续落地。国内应用虽然相比海外虽然存在一定代...……更多
...高精度3D形变算法、“算法+渲染+驱动”自动化流程、多模态网络模型等技术,可通过单张或多张照片生成面部相似度达到90%以上的高自然度虚拟数字人,拥有表情、文本、声音、肢体驱动等多模态交互能力。具有耗时短、成本...……更多
外媒:百度今年下半年将发布新一代人工智能模型
...5.0”进行升级,预计在多模型能力上实现显著改进。“多模态”人工智能可以处理文本、视频、图像和音频,并将它们组合在一起,也可以跨类别转换——例如,文本转换为视频,反之亦然。基础模型可以理解语言并执行广泛的...……更多
平安鹰眼系统十五年:一场专注风险减量的长跑
...0的灾害的预测、预警及灾中的响应时效。进入AI时代,多模态大模型为鹰眼系统3.0建设注入新动能。谢文峰表示,ChatGPT是聚焦语言处理,而多模态大模型把能力拓展到对音频、图像和声音等数据的处理,实现各种听说读写的能...……更多
更多关于科技的资讯:
一缕发丝织就“头上帝国”丨链接世界的河南力量
编者按:从中原大地到全球市场,一批来自河南的新服务新供给品牌企业正加速“出海”,以优质产品为全球消费者提供更多选择。12月12日起
2025-12-19 14:36:00
在国家持续推进税收现代化、优化营商环境的大背景下,企业合规经营与诚信纳税已成为衡量其可持续发展能力的重要标尺。新疆瑞源乳业有限公司作为巴州地区乳制品行业的领军企业
2025-12-19 14:47:00
浙江新昌:一家县属国企的低空经济腾飞记
在2025年公路交通行业数据要素应用创新大赛中,“基于异构低空飞行器协同的智慧巡检与低空运营解决方案”项目,荣获全国三等奖
2025-12-19 14:47:00
在数字化转型与精益管理深度融合的当下,电子商城作为企业物资采购、资源配置的核心载体,其运营效率与服务质量直接影响企业整体运营成本与发展活力
2025-12-19 14:47:00
浙江飞流科技创新模式成就“飞”速度
12月1日,河南省辉县市,河南共城智通低空经济有限公司正式开业,今年8月,该公司以“品牌加盟”形式获得浙江飞流科技有限公司(以下简称“飞流科技”)在河南省新乡市的品牌授权
2025-12-19 14:47:00
全省唯一入选,就在常州高新区新桥街道!
近日,工信部发布《再制造机电产品典型应用案例》公示名单,常州市新北区新桥街道企业常州越新传动系统有限公司(以下简称“越新传动”)的“再制造风电增速齿轮箱及其应用——以华奥新能源
2025-12-19 14:48:00
常州高新区企业向全球“行业第一”发起冲击!
从打桩到投产仅13个月、20万平方米超级工厂高速运转、首款量产产品订单已排至明年……在常州高新区,江苏睿恩新能源科技有限公司正以惊人速度
2025-12-19 14:48:00
从“流量”到“留量”的深水区航行——对话臣良商贸副总王景涛,解码八年增长三倍的“慢”哲学
鲁网12月19日讯(记者 吴美琳)在德州商贸流通领域,“臣良商贸”是一个颇有分量的名字。这不仅因为它与古贝春携手二十六载的风雨同舟
2025-12-19 15:00:00
拨打运营商热线转接4次才接通人工,电商维权遭遇AI客服循环套话,金融咨询“答非所问”却难寻人工入口……本应是提升服务效率的AI客服
2025-12-19 15:22:00
又是首个出海,海尔三筒洗衣机亮相马来西亚
12月17日,海尔智家第七届全球粉丝节在马来西亚正式启幕,这场连接全球粉丝的品牌盛典,打造了为期五天的沉浸式快闪体验空间
2025-12-19 16:08:00
第十次荣获“五星钻石奖”!青岛银行隐藏着什么获奖秘籍?
12月17日,本年度全球服务领域最高荣誉——2025年(第十九届)“五星钻石奖”(Five Star Diamond Brand)在香港举行的“世界经理人峰会”上隆重揭晓
2025-12-19 16:12:00
青岛球迷狂喜!大力神杯首降,海信冰箱将携锁鲜黑科技赴约
鲁网12月19日讯时隔多年,象征足球最高荣誉的大力神杯将再度造访中国!12月21日,这座全球球迷魂牵梦萦的奖杯将在青岛进行24小时免费公展
2025-12-19 16:13:00
今年以来,魏县联社始终坚守“立足县域、服务三农”的初心使命,锚定县域经济发展需求,聚焦服务提质增效核心目标,通过健全服务体系
2025-12-19 17:02:00
鲁网12月19日讯近年来,中国银行临沂分行紧跟临沂市委市政府战略规划,锚定商贸物流西部新城建设和商城出海战略任务,积极做出支持地方经济社会发展的金融贡献
2025-12-19 17:23:00
罗庄农商银行:科技金融为新质生产力“蓄势赋能”
鲁网12月19日讯新质生产力的培育和发展要立足实体经济根基,罗庄农商银行坚守服务实体经济本职,通过深入开展“千企万户大走访”
2025-12-19 17:23:00