• 我的订阅
  • 头条热搜
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
...学院香港创新院AI中心”),日前在香港发布医疗领域AI多模态大模型CARES Copilot1.0。据介绍,CARES Copilot系统由中国科学院香港创新院AI中心研发,是一款专为医疗领域设计的大型模型系统。该系统实现了图像、文本、语音、视频等...……更多
...藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型“坤元”(Sigma Geography)正式发布。据介绍,该大模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,研发团队完成了地...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...模型Qwen2.5系列,同时上架语言、音频、视觉等100多款全模态模型,通义开源模型累计下载量已经突破4000万,通义原生模型和衍生模型总数超过5万,成为仅次于美国Llama的世界级模型群。打造最强AI基建不同于传统IT时代,AI时代...……更多
别只盯着ChatGPT版Her,多模态AI拟人互动上,国内玩家也支棱起来了
... AI 发起挑战的高规格赛事落下了帷幕!这就是第二届多模态情感识别挑战赛(MER24),它由清华大学陶建华教授、中国科学院自动化研究所连政、帝国理工学院 Björn W.Schuller、奥卢大学赵国英以及南洋理工大学 Erik Cambra 联合在 A...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...数据泄露,从而反映模型的真实性能。研究团队测试了多模态大模型(LMMs)和纯文本大模型(LLMs)。对于LLMs的测试,输入时不提供任何与图像相关的信息给模型,仅提供文本。所有评估均采用零样本(zero-shot)思维链(Chain of ...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
鬼手操控着你的手机?大模型GUI智能体易遭受环境劫持
...对用户指令的忠实性。具体而言,AI 是否能够在复杂的多模态环境中不受眼花缭乱的内容所干扰,忠实地完成用户预设的目标,是一个尚待研究的问题,也是实际应用之前必须回答的问题。针对上述问题,本文以图形用户界面智...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
“试用完谷歌的新AI模型,再也不爱GPT”
...越 GPT-4 , Gemini 最特殊的一点是,它是谷歌带来的首个多模态大模型,也就是能不光能打字互动,也能进行语音、视频、图片的互动。按照谷歌的说法,现有的所谓多模态大模型,都是单独训练了文本、视觉和音频等模型,再把...……更多
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...布,“大杀器”Gemini 1.0,正式上线。Gemini是一个原生多模态大模型,谷歌在今年5月的I/O大会宣布开始研发后,Gemini的传说不断:将谷歌大脑和DeepMind部门合并,数百人攻坚,几乎耗尽谷歌内部计算资源……如此种种,只为和OpenA...……更多
Gemini 开启大模型路线之争,新战场将“数流成河”
...一种可能性:具有原生数据优势的互联网巨头,可能在多模态大模型竞争中占据优势。这意味着,谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。大模型战局,进入...……更多
阿里达摩院发布业内首个遥感ai大模型,支持多模态交互
...业应用。IT之家归纳总结该遥感大模型特点如下:支持多模态交互,如输入“提取影像中的耕地农田”,会自动识别所选目标▲图源达摩院DAMO官方公众号支持任意地表目标识别,并建立多级语义标签体系▲图源达摩院DAMO官方公...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...zhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1...……更多
松鼠Ai智适应教育大模型全新升级
...与科技融合的盛宴。松鼠Ai举行发布会,不仅展示了其多模态智适应教育大模型及系统的全方位升级,还推出了多款前沿的智适应教育硬件产品,为AI教学体验带来了革命性的提升。松鼠Ai创始人、首席教育技术科学家栗浩洋在发...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。本次智源评测,分别从主观、客观两个维度考察了语言模型的简单理解、知识运用、推理能力、数学能力、代码能力、任务解决、安全与...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...AI 领域的一家,从去年至今,从星辰语义大模型到星辰多模态大模型和星辰语音识别大模型,中国电信旗下大模型始终保持着快速迭代,且完成了语义、语音、视觉、多模态的全模态大模型布局。7月5日,中电信人工智能科技有...……更多
...大量通用数据、行业数据,支持文本、图像、视频等多种模态,并打造了全流程的数据处理工具。超过700万亿字节的通用数据集可以开展通用模型训练,同时,4.33万亿字节的行业垂类数据对模型训练也极为重要。当前已知的全...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...灵奖得主Yoshua Bengio教授。博士期间的主要工作聚焦于多模态、GFlowNet、多智能体强化学习、AI于气候变化的应用。目前已在ICML、ICLR、ICASSP等机器学习顶会发表论文。代表作为Large-scale Contrastive Language-Audio Pretrai……更多
神仙打架!谷歌新款大模型Gemini 和GPT-4谁能笑到最后?丨科技观察
...眼镜等更多领域上的应用前景有多广阔。“Gemini是原生多模态打造,是(谷歌)通往Gmeini模型时代的第一步。”谷歌首席执行官桑达尔·皮查伊(Sundar Pichai)表示:Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。作为谷歌有...……更多
基于多模态大模型和超大算力,车路云一体化进入3.0阶段
车路云一体化已经从1.0迈入到3.0新阶段,基于多模态大模型和超大算力,实现从数据获取、数据处理到数据分析的自动化、智能化升级,同时根据人类反馈进行强化学习,使数据更精准、质量更高,为解决自动驾驶“长尾问题...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
...ified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示通用人工智能(AGI)技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
中科融合MEMS质量管控 | 持续提升MEMS微镜鲁棒性与耐久性
...RT06 驱动信号频谱分量不同单体的MEMS设备都拥有多个谐振模态,而某些特定的模态的触发会引发MEMS的功能性失效,对MEMS谐振模态的了解以及对驱动信号的正确选择可以极大程度上避免此类的功能性失效从而保证产品的寿命与稳...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要点及具体内容,并附上具体对应邮件的链接,还可以帮助用户提取活动地址并在谷歌...……更多
更多关于科技的资讯:
本文转自:人民网-江西频道1月18日,由宜春市商务局、樟树市人民政府、樟树市邮政分公司联合举办的2025年江西迎春焕新消费季暨宜春邮政(樟树)网上年货节直播活动举行
2025-01-20 20:39:00
潮新闻讯 2025年,消费者买手机、平板、智能手表(手环)有补贴了!日前,国家发展改革委宣布将对个人消费者购买手机、平板
2025-01-20 21:23:00
深耕新质生产力,雅迪电动车携手用户共建低碳新时代
站在新一年的起点回望2024年,中国智造的“向新”力震撼世界,同时也改变着新一代的消费态度,从盲目追求“全球大牌”转向拥戴“国货骄傲”
2025-01-20 21:41:00
手机国补今日开启,河南移动落地国补“第一单”
1月20日,备受瞩目的《手机、平板、智能手表(手环)购新补贴实施方案》手机国家补贴政策正式落地,在河南各地引发热烈反响
2025-01-20 22:13:00
海南:以旧换新新政年内施行首日 手机平板成消费者关注“焦点”
点击查看视频南海网1月20日消息(记者 王子遥)1月20日,2025年海南省家电、手机等数码产品、家装家居换新补贴政策正式开始实施
2025-01-20 20:11:00
赵明辞职 荣耀换帅不影响产品节奏:骁龙8至尊版中端机蓄势待发
快科技1月20日消息,1月17日,荣耀发文官宣换帅,核心人物赵明辞去公司董事、CEO等相关职务,接替其工作的是研发出身
2025-01-20 16:59:00
合肥热电:数据知“冷热”供暖更“智慧”
本文转自:人民网-安徽频道在合肥热电总调度室,一块覆盖了整面墙壁的屏幕显得格外吸睛。屏幕上由数字与图表构成的具象化城市供热系统在屏幕上不停跳动
2025-01-20 16:59:00
“中中”带你读报告⑦丨想换新家电、新汽车,河南有什么政策?
大河网讯 科技、医疗、就业、增收、养老……新的一年,你最关注哪方面的政策?1月18日上午,河南省第十四届人民代表大会第三次会议开幕
2025-01-20 17:03:00
抗衰老抗氧化养颜十大品牌排行榜(NMN、NAD+、胶原蛋白)
随着全球消费市场的蓬勃发展和社会年龄结构的深刻变迁,抗衰老产业已成为当下备受瞩目的明星领域,展现出强大的增长潜力和市场活力
2025-01-20 17:12:00
神农操作系统正式发布
本文转自:人民网-安徽频道发布会现场。1月19日,“神农操作系统发布会暨院士专家论坛”在合肥市长丰县宇桥科技生态园召开
2025-01-20 17:14:00
成美品牌定位为何被称为业内实战权威?
经济周期的不确定性,要求企业在品牌定位上具备更强的韧性和适应性。这意味着,在产品同质化、竞争白热化的市场环境中,函需像成美品牌定位这样的实战派
2025-01-20 17:17:00
沪消保|上海市消保委测评美甲灯:存在紫外光源安全风险 照灯时应进行防护
中国消费者报上海讯(记者刘浩)春节即将到来,很多消费者预约了新春美甲。据了解,光疗美甲过程中需要借助美甲灯来照射固化,那么
2025-01-20 17:18:00
爸爸带娃买了一斤豆坐飞机:宝宝全程保持安静
1月20日消息,据媒体报道,爸爸带娃坐飞机,怕她吵到别人,买了一斤豆让宝宝从登机挑到下机,宝宝全程安静挑豆豆。这条视频引发热议
2025-01-20 17:29:00
一男子去年成功举报1945起交通违法:根本不为奖励
快科技1月20日消息,如果在路上遇到违法交通法的驾驶行为,你会如何做?相信很大一部分人都会选择多一事不如少一事,然而也有较真的朋友
2025-01-20 17:29:00
OPPO Find N5宣传语曝光:折叠之王 又薄又强
快科技1月20日消息,OPPO Find N5折叠屏近期大规模预热,该机在2月份发布,将成为全球最薄折叠屏旗舰。OPPO周意保今天发文透露
2025-01-20 17:29:00