模态,史诗,基准,难度,问答,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

未来医院变形记：生成式AI将病历书写从8小时缩短至25分钟

...与智能手机等工具的交互存在数字鸿沟。AI陪诊师利用多模态交互技术，老年患者通过文本或语音与AI陪诊师互动，就能获得清晰的语音版和文本版就医指导，缩短数字鸿沟。第二，服务流程复杂，患者晕头转向。就医过程中，...……更多

2024-07-09 09:30:00变形记,病历,生成,小时,医院,医院

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...晨，美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。据OpenAI公司首席技术官米拉·穆拉蒂（Mira Murati）介绍，GPT-4o可以接收文本、音频和图像的任意组合作为输入，并实时生成文本、音频和图像的任意组合进行...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

文本图格式大一统！首个大规模文本边基准TEG-DB发布 |

...里大学等机构的研究人员首次提出了文本边图的数据集与基准，包括9个覆盖4个领域的大规模文本边图数据集，以及一套标准化的文本边图研究范式。该研究的发表极大促进了文本边图图表示学习的研究，有利于自然语言处理与...……更多

2024-11-09 13:34:00大规,本图,基准,大规模,文本,格式

多样任务真实数据，大模型在线购物基准Shopping MML

谁是在线购物领域最强大模型？也有评测基准了。基于真实在线购物数据，电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU，用以评估大语言模型在在线购物领域的...……更多

2024-11-21 09:45:00在线购物,基准,模型,任务,购物,数据

商汤科技sensetime推出“云端边”全栈大模型体系

...a5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据，全新的“日日新SenseNova5.0”（以...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

...达到 750 亿参数，性能获得了大幅升级。AInno-75B 增加了多模态处理能力，支持输入文本、图像、视频以及工业场景中的行为（Action）模态，如 CAD 等。通过引入高参数量大模型 AInno-75B，创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

解锁多模态语篇中“看”的微技能

...新增了“看”的技能。语言技能中的“看”通常指利用多模态语篇中的图形、表格、动画、符号以及视频等理解意义的技能。理解多模态语篇，除了需要使用传统的阅读技能之外，还需要观察图表中的信息，理解符号和动画的意...……更多

2023-12-27 00:39:00模态,技能,学生,技能,英语,活动

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...在阶跃星辰开放平台通过API接入使用Step-2。语言模型和多模态模型全都要开篇咱们提到，Step模型是一个系列，而Step-2是其语言模型的实力代表。在这个系列中，除了语言模型，阶跃星辰的多模态模型也很有看头。Step-1.5V是阶跃...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

华为云盘古大模型&讯飞星火落地贵州产业化启动仪式举行

...言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力七大维度的能力持续提升，正向主动问答和AI人设“纵深”发展。“此次科大讯飞和贵安发展集团的合作重点是双方共同构建基于大模型的场景运营平台，这将有...……更多

2024-01-16 12:00:00盘古,讯飞,星火,华为,贵州,落地

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

【新智元导读】Meta首个理解图文的多模态Llama 3.2来了！这次，除了11B和90B两个基础版本，Meta还推出了仅有1B和3B轻量级版本，适配了Arm处理器，手机、AR眼镜边缘设备皆可用。Llama 3.1超大杯405B刚过去两个月，全新升级后的Llama 3....……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

用过GPT-4 Turbo以后，我们再也回不去了

...年 4 月。定制化：GPT3 16k、GPT4 微调、定制模型服务。多模态：Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源（即将推出 API）。与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...次发布基于CogVideoX的清影，使其大模型矩阵又扩充类一个模态。值得一提的是，这也是国内做语言大模型起家的大模型独角兽，首次推出视频生成产品——之前这个赛道更多的是字节、快手等短视频大厂，以及爱诗科技、生数科...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

北京智源研究院发布原生多模态世界模型Emu3

...者刘峣）近日，北京智源人工智能研究院正式发布原生多模态世界模型Emu3。该模型实现了视频、图像、文本三种模态的统一理解与生成，成功验证了基于下一个token（词元）预测的多模态技术范式，释放其在大规模训练和推理上...……更多

2024-10-24 05:12:00模态,北京,研究院,模型,研究,世界

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...分校计算机科学与技术系特聘教授俞士纶、国际关联数据基准委员会（LDBC）副主席 Alastair Green、中国人寿财产保险有限公司人工智能开发团队负责人孔宇飞、蚂蚁数字科技 AI 技术负责人章鹏、蚂蚁集团图计算解决方案架构师崔...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

【地评线】东湖评论：勇立科技革命的浪潮之巅

...言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等方面的功能也在逐步完善。这些大模型的应用领域日益扩大，从知识问答到内容生成，再到创意策划和编程辅助等多种场景需求，都可以找到它们的身影，都可...……更多

2023-10-19 12:11:00东湖,浪潮,革命,评论,科技,科技

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

易联众发布民生信息服务大模型平台,助推民生事业提质增效

...运维成本。最后,“智鼎云帆”行业大模型打破了传统AI单模态数据处理的局限性,能同时支持语音、文本、文档、图像、视频等多种用户交互模式,提供更加智能、亲近以及高效的交互体验。追求服务普遍性和公平性,易联众找到了...……更多

2024-03-18 10:00:00民生,联众,助推,模型,事业,服务

创新奇智：双轮驱动用AI赋能中国制造

...模型”，其拥有150+亿参数量，具有行业化、轻量化、多模态的特点，支持包括文本类生成、视觉类生成等多模态应用，是一款更懂制造业的行业大模型。不同于ChatGPT这类依托于公开互联网数据的通用预训练大模型，创新奇智工...……更多

2023-10-10 12:01:00双轮,中国制造,中国,驱动,制造,制造

Pika、阿里同日炫技！国产视频大模型奋起直追

...频，表情、五官、姿势都会产生非常自然的变化。在AI多模态领域，科技巨头、明星初创企业似乎把火力集中到了同一个方向——AI视频生成，Sora的火热更是一石激起千层浪，同类产品发布你追我赶，战况之焦灼可见一斑。在该...……更多

2024-03-01 09:26:00阿里,奋起,模型,国产,视频,视频

谷歌推出其最先进AI模型Gemini，希望击败GPT-4

...和音频并与之交互的能力。这很大程度上是设计使然：多模态在最开始就是Gemini计划的一部分。谷歌没有像OpenAI构建DALL·E（文生图模型）和Whisper（语音识别模型）那样单独训练图像和语音模型，而是从一开始就建立为一个多感...……更多

2023-12-07 10:21:00最先,模型,比斯,模型,哈萨,人工智能

杨幂+小兰会是什么样？中山大学新AI成果，实现人脸个性化SO

...山大学、联想的研究团队推出了ConsistentID，可在细粒度多模态面部提示下，仅利用单张参考图像生成多样的肖像，且保持五官的一致性。最终在人脸个性化任务处理上，相比腾讯的photomaker和小红书的instantID，在五官一致性保持...……更多

2024-05-22 15:47:00小兰,中山大学,人脸,中山,成果,个性

智谱AI杀入视频生成：「清影」上线，时长6秒，免费不限量

...。全自研技术All in 大模型的智谱 AI，很早就开始部署多模态生成式 AI 模型。从 2021 年开始，智谱 AI 先后发布了 CogView（NeurIPS’21）、 CogView2（NeurIPS’22）、CogVideo（ICLR’23）、Relay Diffusion（ICLR’……更多

2024-07-27 09:27:00清影,时长,生成,视频,清影,视频

国内首款安全应急智能模型上线运营

...自我学习与知识更新、文本高效生成、图像理解分析、多模态融合与应用拓展能力，专业知识问答更准确、预案制定修订更实用、图像识别解答更专业、法律法规解析更全面。据研发团队介绍，“大羽安全应急模型”的独创性是...……更多

2024-04-30 18:26:00应急,模型,运营,智能,安全,应急

钉钉AI助理升级上线文档速读等功能

...了图片理解、文档速读、工作流等产品能力，率先探索多模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型，升级后的钉钉AI助理可以完成这些工作：进入AI助理对话框，发送长文件、在线文档、网页链接、视频...……更多

2024-04-03 07:00:00助理,升级,功能,文档,助理,工作流