• 我的订阅
  • 头条热搜
未来医院变形记:生成式AI将病历书写从8小时缩短至25分钟
...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术,老年患者通过文本或语音与AI陪诊师互动,就能获得清晰的语音版和文本版就医指导,缩短数字鸿沟。第二,服务流程复杂,患者晕头转向。就医过程中,...……更多
arxiv研究人员:多模态ai模型存在安全隐患
...论文指出,包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型,处理用户的多模态输入(例如一起输入图片和文本内容)之后,输出结果并不安全。这项研究标题为《跨模态安全调整》(Cross-ModalitySafetyAlignment),提出了...……更多
...晨,美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,GPT-4o可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合进行...……更多
文本图格式大一统!首个大规模文本边基准TEG-DB发布 | NeurIPS 2024
...里大学等机构的研究人员首次提出了文本边图的数据集与基准,包括9个覆盖4个领域的大规模文本边图数据集,以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究,有利于自然语言处理与...……更多
多样任务真实数据,大模型在线购物基准Shopping MMLU开源
谁是在线购物领域最强大模型?也有评测基准了。基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...达到 750 亿参数,性能获得了大幅升级。AInno-75B 增加了多模态处理能力,支持输入文本、图像、视频以及工业场景中的行为(Action)模态,如 CAD 等。通过引入高参数量大模型 AInno-75B, 创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多
...新增了“看”的技能。语言技能中的“看”通常指利用多模态语篇中的图形、表格、动画、符号以及视频等理解意义的技能。理解多模态语篇,除了需要使用传统的阅读技能之外,还需要观察图表中的信息,理解符号和动画的意...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到,Step模型是一个系列,而Step-2是其语言模型的实力代表。在这个系列中,除了语言模型,阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多
华为云盘古大模型&讯飞星火落地贵州产业化启动仪式举行
...言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力七大维度的能力持续提升,正向主动问答和AI人设“纵深”发展。“此次科大讯飞和贵安发展集团的合作重点是双方共同构建基于大模型的场景运营平台,这将有...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
【新智元导读】Meta首个理解图文的多模态Llama 3.2来了!这次,除了11B和90B两个基础版本,Meta还推出了仅有1B和3B轻量级版本,适配了Arm处理器,手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月,全新升级后的Llama 3....……更多
用过GPT-4 Turbo以后,我们再也回不去了
...年 4 月。 定制化:GPT3 16k、GPT4 微调、定制模型服务。 多模态:Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源(即将推出 API)。 与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多
智谱AI“中国版Sora”实测:6秒视频排队2分钟,猫猫很可爱,人手很翻车
...次发布基于CogVideoX的清影,使其大模型矩阵又扩充类一个模态。值得一提的是,这也是国内做语言大模型起家的大模型独角兽,首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂,以及爱诗科技、生数科...……更多
...者刘峣)近日,北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成,成功验证了基于下一个token(词元)预测的多模态技术范式,释放其在大规模训练和推理上...……更多
只有谷歌受伤的世界达成了,但“全能模型”到底该不该跟?
...对二,谷歌就跟四个王。那么,这一次较量的核心——多模态大模型,国内AI行业是否要跟进呢?如果要跟进,又该提前考量到哪些问题呢?每一次新产品问世,如果只跟着新闻“震惊”是很难进步的。不妨和我们一起,认真给G...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...分校计算机科学与技术系特聘教授俞士纶、国际关联数据基准委员会(LDBC)副主席 Alastair Green、中国人寿财产保险有限公司人工智能开发团队负责人孔宇飞、蚂蚁数字科技 AI 技术负责人章鹏、蚂蚁集团图计算解决方案架构师崔...……更多
...言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面的功能也在逐步完善。这些大模型的应用领域日益扩大,从知识问答到内容生成,再到创意策划和编程辅助等多种场景需求,都可以找到它们的身影,都可...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
易联众发布民生信息服务大模型平台,助推民生事业提质增效
...运维成本。最后,“智鼎云帆”行业大模型打破了传统AI单模态数据处理的局限性,能同时支持语音、文本、文档、图像、视频等多种用户交互模式,提供更加智能、亲近以及高效的交互体验。追求服务普遍性和公平性,易联众找到了...……更多
...模型”,其拥有150+亿参数量,具有行业化、轻量化、多模态的特点,支持包括文本类生成、视觉类生成等多模态应用,是一款更懂制造业的行业大模型。不同于ChatGPT这类依托于公开互联网数据的通用预训练大模型,创新奇智工...……更多
Pika、阿里同日炫技!国产视频大模型奋起直追
...频,表情、五官、姿势都会产生非常自然的变化。在AI多模态领域,科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成,Sora的火热更是一石激起千层浪,同类产品发布你追我赶,战况之焦灼可见一斑。在该...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...和音频并与之交互的能力。这很大程度上是设计使然:多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E(文生图模型)和Whisper(语音识别模型)那样单独训练图像和语音模型,而是从一开始就建立为一个多感...……更多
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
...山大学、联想的研究团队推出了ConsistentID,可在细粒度多模态面部提示下,仅利用单张参考图像生成多样的肖像,且保持五官的一致性。 最终在人脸个性化任务处理上,相比腾讯的photomaker和小红书的instantID,在五官一致性保持...……更多
智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量
...。全自研技术All in 大模型的智谱 AI,很早就开始部署多模态生成式 AI 模型。从 2021 年开始,智谱 AI 先后发布了 CogView(NeurIPS’21)、 CogView2(NeurIPS’22)、CogVideo(ICLR’23)、Relay Diffusion(ICLR’……更多
...自我学习与知识更新、文本高效生成、图像理解分析、多模态融合与应用拓展能力,专业知识问答更准确、预案制定修订更实用、图像识别解答更专业、法律法规解析更全面。据研发团队介绍,“大羽安全应急模型”的独创性是...……更多
...了图片理解、文档速读、工作流等产品能力,率先探索多模态、长文本与RPA技术在AI应用的落地。 基于阿里通义千问大模型,升级后的钉钉AI助理可以完成这些工作:进入AI助理对话框,发送长文件、在线文档、网页链接、视频...……更多
王小川公布最新大模型,号称全球最长上下文,是GPT-4的14倍|钛媒体焦点
...研路径。同时,其更长的上下文还将为行业探索Agent、多模态应用等前沿领域打下良好技术基础。(本文首发钛媒体App,作者|林志佳)返回搜狐,查看更多责任编辑: ……更多
谷歌在AI赛道加速
...图像-文本预训练、视觉问答、图像描述、视觉推理、多模态检索等多个领域。它有望推动多模态学习技术的进一步发展,并为人工智能领域带来新的突破。当然,该系统完全依赖于其训练数据的质量,如果没有人工整理的最高...……更多
全国产算力平台“飞星一号”的首个成果发布:讯飞星火V3.5来了
...本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面进行了全面升级。其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。此外,讯飞星火V3.5对年终总结计划、述职PPT...……更多
“解锁”AI云盘新体验!中国移动云盘通过3项AI算法备案
...中,中国移动云盘3项大模型算法成功通过备案,涵盖多模态大模型、文本生成算法等。去年9月,中国移动云盘启动AI智能工具内测,本次算法备案成功标志着中国移动云盘可正式对外提供深度合成人工智能服务,在国内AI云盘赛...……更多
更多关于科技的资讯:
如不能正常浏览请选用IE浏览器天津北方网讯:潮购津门,乐呵过年。第二届天津电商节年货节,“一站式”购齐年货,欢欢喜喜过大年。#你好天津 #点赞天津……(津云新闻编辑张麒麟)
2025-01-27 15:37:00
AI入口 “爱”的入口
江南时报讯 春节是团圆的盛宴,凝聚着家的灵魂、力量与温暖。南来北往的游子,对于“家”有着更深的情结与眷恋。春运期间,中国电信联合江苏交通文化传媒有限公司在江苏高速阳澄湖
2025-01-27 15:51:00
完美世界再发反腐通报:开除4人,永不录用
根据一份流传到网上的内部公告,1月24日,完美世界开除了百万工作室四人,其违规行为包括在素材制作外包管理方面玩忽职守,构成严重失职
2025-01-27 16:03:00
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁)
过年回家,你锁门了吗?Zigbang直帮(原三星指纹锁),自动上锁不操心随着春节的脚步日益临近,人们纷纷踏上了归家的旅程
2025-01-27 16:11:00
这种小番茄有剧毒!很多人还把它当观赏植物 快看你家有没有
去年,美国女演员艾丽西亚·西尔维斯通(Alicia Silverstone)发了一个短视频,说自己在路边摘了一个橙色小番茄
2025-01-27 16:36:00
潍坊美的火三月震撼来袭,超绝福利“高能”释出!
3月7日-3月16日,一年一度的美的火三月将火爆开展,作为美的家电每年的核心活动节点,已经传承了17载。它不仅是美的与消费者之间的约定
2025-01-27 16:46:00
厂商官方承认:RTX 50确实货不多!一家都不到100块
快科技1月27日消息,RTX 5090/5090D、RTX 5080都将在1月30日大年初二晚上正式开售,但这次供货之紧张前所未有
2025-01-27 17:06:00
DeepSeek实习生日薪最高达上千元 招人不看经验只看能力
快科技1月27日消息,近日,国产大模型DeepSeek震动美国硅谷,其移动App一举登顶苹果中国和美国应用商店免费APP下载排行榜
2025-01-27 17:06:00
女子帮忙按600斤年猪脸被踢肿 网友:古有四大按不住
1月27日消息,近日,贵州贵阳一女子帮叔叔们一起按住600斤的年猪,年猪不停挣扎,一脚踢到女子脸上。她表示:“脸被踢肿了
2025-01-27 17:06:00
一谈起自动化汽车工厂,人们脑海中常常浮现出这样的场景:机器人手臂在精确装配线上舞动,高效焊接、喷涂车身;智能AGV小车穿梭其间
2025-01-27 17:06:00
Windows 11 24H2新年第一个补丁惹大祸:各种不正常、崩溃
快科技1月27日消息,Windows补丁惹事儿不是新闻,但是作为Windows 11 24H2 2025年的第一个补丁
2025-01-27 17:36:00
最高补贴2000元!青岛以旧换新“加力扩围”至12类
齐鲁晚报·齐鲁壹点 尚青龙青岛市2025年消费品以旧换新活动已于日前正式启动,记者从青岛市商务局、青岛市财政局获悉,为进一步惠及广大消费者
2025-01-27 17:42:00
提到线上“带货”,大家可能都不陌生。不论是食品、服装、电子产品,还是诸如电影票、餐饮券、旅游套餐等生活服务产品,都是我们常见的线上“带货”商品
2025-01-27 18:35:00
苏州移动启动首个5G-A通感一体“协作感知”方案的城区规模组网测试
近日,苏州移动正式启动了首个5G-A通感一体“协作感知”方案的城区规模组网测试,标志着5G-A技术在通信与感知融合上的重大突破
2025-01-27 18:38:00
三星Galaxy Z Flip 7相机规格泄露:与前代无差异 聚焦AI增强
快科技1月27日消息,据荷兰科技媒体Galaxy Club消息,三星即将发布的Galaxy Z Flip 7小折叠手机在相机硬件上并没有带来令人惊喜
2025-01-27 19:06:00