• 我的订阅
  • 头条热搜
厦大教授团队自主研发的思源大模型“霸榜”权威榜单,“优等生”是怎样炼成的?
...型榜单客观能力评测中排名第一(2024年1月);在腾讯多模态大模型榜单中排名第一(2023年11月)。事实上,在过去十年里,许多AI头部企业的主打产品都有思源大模型团队的技术加持。目前,思源大模型团队已与华为、腾讯等...……更多
讯飞输入法发布行业首个输入法认知大模型:生成式AI全赋能
...一代输入法认知大模型,涵盖文本生成、多语言语音、多模态生成的生成式AI能力矩阵,做更靠近业务的解决方案。丁克玉特别提到,当前一代的输入法基于编解码模式预测输出,对用户意图理解能力有限。然而下一代的输入法...……更多
...GPT助手的,新的GPT支持图像、语音等很可能影响那些做多模态的,更遑论那些开发AI智能体或者做知识库扩充的等等。对中国的AI创业者来说,他们所面对的,也早已不是互联网和移动互联网时期的有路径可循。他们必须重新思...……更多
大华股份:自研星汉大模型,推动智慧应用商业落地
...(002236)。事件:近日大华股份发布公告,公司发布了多模态融合的行业视觉大模型——大华星汉大模型,通过融合图像、点云、文本、语音等多模态数据,显著提升了视觉解析能力。点评:机器视觉垂类龙头厂商,业绩持续高...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...,不同于ChatGPT、GPT-4模型率先发布文本功能再逐渐扩充多模态功能,Gemini被设计为原生多模态大模型,从一开始就支持多模态输入输出。Pichai对此讲道:“就像人一样,它不仅从文本中学习,还能通过视频、音频和代码进行学习...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
人工智能的发展速度可能超乎你的想象。自GPT-4将多模态技术引入公众视野以来,多模态大模型进入快速发展阶段,逐渐从单纯的模型研发转向垂直领域的探索和应用,与各行各业深度融合。在界面交互领域,谷歌、苹果等国际...……更多
谷歌chrome地址栏整合gemini聊天机器人
...Gemini是谷歌Deepmind最新、最强大的AI模型。它原生支持多模态,具备跨模态推理能力,包括文本,图像,视频,音频和代码。Gemini分为三个版本Ultra-三个模型版本中功能最强大,适用于高度复杂的任务Pro-适用于广泛任务的最佳模...……更多
烟台毓璜顶医院毛宁:大数据与人工智能帮他开“慧眼”,让疾病无处遁逃
...佛多了一双“慧眼”,在面对疾病时更得心应手。建立多模态数据库,借助影像人工智能技术来预测肿瘤分期及预后情况,并利用多种成像方式分析大脑结构、功能和代谢等生理变化与精神疾病的关联,毛宁和团队正致力于推动...……更多
...精细化标注水平,积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设,不断提升智能算力综合供给水平;稳步推进公共算力服务平台建设,...……更多
...汤科技等新老股东一同跟投。所募资金将用于完善具有多模态能力的领域大模型在园区、企业、经济、能源等多场景的应用,打造高灵活度、高性能的智算基础设施,构建技术壁垒,进一步在人工智能物联网领域的国际竞争格局...……更多
不要小看「实而不华」的腾讯 AI
...未来的战略思路。01模型侧:基础模型能力升级,构建多模态能力首先是基础模型方面,5 月 17 日的峰会上,腾讯混元介绍了其多尺寸的 LLM 模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在 1B、3B、7B、13B 等不同参数量...……更多
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
...,使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入(M-ROPE)方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息,M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...与微软争相拼臂力秀肌肉。Gemini 1.5 Pro的横空出世,将多模态大模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
...,人形机器人核心产业实现收入力争突破10亿元。推动多模态大模型应用当前,人形机器人技术加速演进,已成为科技竞争的新高地、未来产业的新赛道、经济发展的新引擎。石景山区已集聚人形机器人产业各环节企业16家,覆...……更多
五福节成AI互动应用练兵场 支付宝技术迭代提速
...完成备案,除了语言大模型外,蚂蚁集团也在研发百灵多模态大模型,并已进入内测阶段,形成了涵盖大模型底层基础设施、基础大模型、行业大模型和应用产品的完整技术链条。近期,蚂蚁集团内部成立了专注于AI创新研发与...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在美开售,库克称将很快登陆中国脑机接口公司Neuralink完成首例人脑植入手术 Hugging Face推出可定制AI个人助手苹果发布2024年Q1财报...……更多
基于多模态大模型和超大算力,车路云一体化进入3.0阶段
车路云一体化已经从1.0迈入到3.0新阶段,基于多模态大模型和超大算力,实现从数据获取、数据处理到数据分析的自动化、智能化升级,同时根据人类反馈进行强化学习,使数据更精准、质量更高,为解决自动驾驶“长尾问题...……更多
Sora概念引爆A股!谁在布局AI视频
...技、会畅通讯、博汇科技等个股均涨停收盘。盘面上,多模态AI板块领涨A股,板块涨幅高达11.11%,板块内32只个股全部飘红,其中14只个股涨停;此外AIGC概念、Web3.0等板块同样涨幅居前。消息面上,近日,OpenAI推出了新的文生视...……更多
AI生成式视频往何处去 “灵动 AI”亮相网易未来大会
...的。现在试想,如果上传的商品信息既能在文字、图像等模态上保持不变,又能够与文字、图片、视频等模态模型实现很好的融合,从而为商家产出AI商品图、海报、短视频,甚至是3D交互内容,这个市场需求是很大的。今年,...……更多
趣丸科技推出天谱乐大模型,可一键让视频开口唱歌
...inaJoy)在上海新国际博览中心开幕。由趣丸科技打造的多模态配乐大模型“天谱乐”惊喜亮相,成为本届大会最具创新的展品之一。天谱乐大模型不仅支持文生音乐、音频生音乐,还首创图片/视频生音乐功能,多模态输入能力...……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
中国电信星辰AI大模型开源自研AI创新成果助推数字中国建设“正当时”
...国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。视觉大模型赋能100+城市治理下...……更多
大模型的未来,快手在自己身上找答案
...有 GPT-4o 不具备的表情和肢体动作,是一个真正意义的多模态输入输出的实时互动智能体。快手展位「AI 关小芳」数字人 | 图片来源:视觉中国而另一片场地上,快手视频生成大模型明星「可灵」发布了一系列重磅升级和 AIGC 短...……更多
讯飞星火V3.5春季上新,科大讯飞首发星火图文识别大模型
...你也能化身法律专家。越来越多的从业者已经认识到,多模态能力将是未来衡量大模型可用性、易用性的重要指标。视觉作为多模态能力的最重要的一环,可以帮助大模型实现从单纯的文本能力到感知物理世界的巨大飞跃,为未...……更多
Sora炸圈后哑火,国产视频大模型接棒降门槛
...经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先...……更多
360 奇元大模型宣布通过备案,自研两大模型均实现获批
...技企业。据介绍,360智脑大模型集成了360GPT大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,覆盖大模型全部应用场景。用户可通过 ai.360.com一站式登录体验360智脑App、3...……更多
“不要卷模型,要卷应用!”李彦宏谈AI:大模型公司热衷于写高考作文,价值不大
...,拥有高度仿生的躯干构型和拟人化的运动控制,支持多模态机动、多模态感知、多模态交互和多模态操控,全身多达43个主动自由度,最大关节峰值扭矩400N.m,算力支持400TOPs。 图片来源:上海证券报运动能力上,“青龙”人...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
百融云创荣获“2024大模型创新应用奖”
...知识为大模型后续的价值释放提供了源源不绝的动力。多模态融合百融云创大模型与多模态进行了有效的融合。比如基于大模型和语音技术的融合,大模型和动画影像的融合,打造的数字员工和数字人产品,能支持多国语言,提...……更多
更多关于科技的资讯:
[摘要]随着人工智能技术的迅猛发展,高等教育正在经历深刻变革。这就要求高校在研究生培养模式上深化改革,大胆创新,积极推动人工智能(AI)技术在研究生培养中的融合路径与实践
2025-12-22 11:10:00
据媒体报道,今年以来,杭州知名“网红大楼”丽晶国际大厦——这座巅峰时期汇聚了近两万名主播与从业者、“一栋楼的GDP堪比一个县”的楼宇
2025-12-22 08:18:00
味蕾实验TASTELAB首次亮相引领零食行业科学化升级新征程
2025年12月20日,全新零食品牌味蕾实验TASTELAB在上海正式举办品牌发布会。本次活动以“让味觉被看见”为核心主题
2025-12-22 08:49:00
乌江榨菜全民创意共创:深度对话Z世代的品牌焕新
当传统品牌纷纷叩响年轻化的大门,仅靠历史底蕴已不足以触动Z世代的心。作为榨菜行业的领军者,乌江榨菜早已展开前瞻布局:从早年携手B站打破次元壁
2025-12-22 08:49:00
在保险行业向专业化、精细化、集约化发展的背景下,富德生命人寿以科技引领创新,积极布局集约化运营模式,构建起以总部为核心的全国理赔集中运营格局
2025-12-22 10:32:00
彰显实力!大咖素质训练营荣获“2025年度影响力教育品牌”奖项
近日,由新浪教育与微博教育联合主办的“新浪&微博 2025 教育盛典”于北京圆满落幕。大咖素质训练营凭借在素质教育领域的深耕积淀
2025-12-22 10:49:00
不用提前抢,西湖消费券带火实体商户:3天,星巴克黄龙广场店增收50%
作为促消费的首创实践,杭州西湖区“疯狂碰友日・西湖首发季”交出亮眼成绩单:首期三天,21 万市民参与“即碰即用”消费券活动
2025-12-22 10:49:00
近日,深耕青少年语言教育领域近十年的创业者徐萌,凭借其专业的课程体系与显著的教学成效,受到教育界广泛关注。徐萌毕业于中国传媒大学播音与主持专业
2025-12-22 08:49:00
张明磊摘要:随着数字化转型的深入推进,企业创新活动的结构与逻辑正在发生根本性变化。数据、算法与平台成为核心生产要素,推动企业从封闭式研发向跨组织
2025-12-22 06:58:00
马辉 山东广播电视台摘要:凭借弹性扩展、资源共享、高效协同等突出优势,在融媒体与数字化变革的浪潮中,云转播技术在广播电视行业的应用场景日趋丰富
2025-12-22 06:58:00
富瑞浦张序宝:一位浙商的品牌出海“长征”
从2001年怀揣着开拓国际贸易和自主品牌的梦想远赴俄罗斯,到如今业务遍布数十个国家,富瑞浦的23年,是一部浓缩的中国制造业出海史
2025-12-22 07:48:00
12月8日,浮力森林公众号发布了一则“破产公告”,这家在杭州开了20多年的老牌烘焙店正式画上句号。自2020年7月首度关门闭店后
2025-12-22 06:47:00
太原日报社《朝阳专刊》今日正式亮相
“美美朝阳”微信公众号二维码由太原日报社倾力打造的《朝阳专刊》今日正式亮相,“美美朝阳”微信公众号已上线,为读者朋友们提供更及时
2025-12-22 07:11:00
国家人工智能应用中试基地(医疗)·浙江开放服务12月20日,国家人工智能应用中试基地(医疗)·浙江(以下简称“浙江基地”)多项年度成果发布
2025-12-21 08:22:00
“厦门制造”发力长时储能赛道
海辰储能生产线。(资料图)厦门网讯(厦门日报记者 李晓平)当下,新能源汽车、数据中心等场景电力需求快速增长,全球能源结构正向可变可再生能源加速转型
2025-12-21 09:02:00