• 我的订阅
  • 头条热搜
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...循指令方面的能力有关。如果模型无法准确地遵循指令,生成CoT解释就会变得更加困难。此外,有些模型无法保持正确的回复格式,即存在所谓的「简化回复格式」问题。 ……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
ChatGPT的出现,彻底将生成AI推向爆发。但别忘了,AI生成模型可不止ChatGPT一个,光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年,效果好的AI生成模型层出不穷,又以OpenAI、Meta...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...。 另外,微调还可以减轻由于使用mask而产生的任何不良生成伪影。MoE和分层扩展MoE能够增加模型的参数和表达能力,而不会显著增加训练成本。作者使用基于专家选择路由的简化MoE层,每个专家确定路由到它的token,而不需要...……更多
4090笔记本0.37秒直出大片!英伟达联手MIT清华祭出Sana架构,性能秒杀FLUX
...出的Sana架构,得益于核心架构创新,具备了惊人的图像生成速度,而且最高能实现4k分辨率。一台16GB的4090笔记本,仅需0.37秒,直接吐出1024×1024像素图片。如此神速AI生图工具,竟是出自英伟达MIT清华全华人团队之笔!正如其名...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...现出色。这些技术的创新使得Gemini 2.0能够更好地理解和生成自然语言,增强了人机交互的智能性。即日起,开发人员便可在AI Studio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用,而且该版本也已经在网页版中为Gemini Advanced开放试...……更多
潍坊七夕相亲季开幕在即,壹点相亲数字交互产品全新上线
...、高鼻梁、长相温文尔雅……”仅需三步就可以让AI帮你生成你心目中“理想型”。您可以根据页面提示,选择理想型的五官、发型、脸型等基本特征,在补充栏内详细描述你对理想另一半的要求,AI将智能生成一位符合您要求...……更多
一句话搞定UI设计!Figma开卷AI,人人都成「设计大神」
...晰的图片能有效增强视觉效果。因此,Figma推出了AI内容生成工具,帮助用户在设计中快速填充相关的逼真视觉内容。通过加入与实物一样鲜明生动的画面,形成更具吸引力和说服力的视觉效果,有效传达设计理念。此外,Figma还...……更多
3秒让AI生成风险减少30%!复旦新研究拿下扩散模型概念移除新SOTA
...模型变“乖”,现在仅需3秒调整模型参数。效果be like:生成的风险图片比以往最佳方法减少30%!像这样,在充分移除梵高绘画风格的同时,对非目标艺术风格几乎没有影响。在移除裸露内容上,效果达到“只穿衣服,不改结构...……更多
又一生成式AI助手将“登机”!谷歌发布多模态Bard助理,交互式AI时代近了?
...Bard助理(Assistant with Bard)”,将手机的个人助手功能与生成式AI相结合,用户可通过文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。例如,当用户询问“本周我错过了哪些重要邮件”时,Bard助理会列出各项要...……更多
我的AI理想型!壹点相亲数字交互产品全新上线,给您脱单新体验
...、高鼻梁、长相温文尔雅……”仅需三步就可以让AI帮你生成你心目中“理想型”。您可以根据页面提示,选择理想型的五官、发型、脸型等基本特征,在补充栏内详细描述你对理想另一半的要求,AI将智能生成一位符合您要求...……更多
推动终端侧AI发展 MWC2024高通带来多项全球首发
...AIHub为开发者提供全面优化的AI模型库,包括传统AI模型和生成式AI模型,能够支持在骁龙和高通平台上进行部署。 在使用高通AIHub时,开发者可以选择所需的大模型,例如Baichuan-7B,然后可以选择开发应用所使用的框架,例如例...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...图标描述模型以及光学字符识别(OCR)模块的输出,可以生成用户界面的结构化表示,类似于文档对象模型(DOM),以及一个叠加潜在可交互元素边界框的屏幕截图。可交互区域检测(Interactable Region Detection)从用户界面屏幕中...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...括Micro、Lite、Pro、Premier四个版本的语言模型,还有图像生成模型Canvas、视频生成模型Reel。其中Reel现支持生成6秒视频,很快将会延长到2分钟。亚马逊总裁兼CEO安迪·贾西现场剧透:明年,AWS不仅将发布语音转语音模型,还有更...……更多
Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功
【新智元导读】Meta版Sora,就在刚刚惊艳来袭。Movie Gen可生成1080p、16秒、每秒16帧的高清长视频,还能生成音效、编辑视频、上传图像生成个性化视频。甚至Meta还放出了92页论文,模型架构、训练细节一并公开,干货满满!毫无...……更多
昆仑万维2024年前三季度营收38.3亿,以大模型技术驱动多款AI应用创新
...用实现多样化功能创新,并逐步在全球落地。图为天工AI生成AGI与AIGC业务方面, 首先,天工AI智能助手持续迭代更新,在网页端率先推出三大全新功能:高级搜索模式、彩页和宝典。天工AI智能助手-高级搜索模式(网页端) 2023年8...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...量子位 | 公众号 QbitAI超越扩散模型!自回归范式在图像生成领域再次被验证——中科大、哈工大、度小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像,超越当前一众包括SDXL在内扩散模型的性能。此外在生成图...……更多
苹果ios18.1中文版将于明年发布
...清理”工具,可从照片中删除不需要的人或物体,并使用生成式AI填充背景;可以在照片应用中通过输入描述来创建回忆影片;电话录音和转录;新的专注模式“减少干扰”仅显示重要通知;在Safari应用程序中使用阅读器模式时...……更多
OpenAI宣布DALL-E 3模型向免费用户开放,但每天只能生成两张图片
...,OpenAI 宣布 ChatGPT 免费用户可以每天使用其 DALL-E 3 模型生成图片。IT之家注:DALL-E 3 于去年 9 月推出,起初只面向 ChatGPT Plus 付费订阅用户提供。 用户可以直接在 ChatGPT 的输入框中键入生成图片相关指令,但经过实测,这项功...……更多
马斯克评OpenAI首个视频生成模型:人类认赌服输
OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频...……更多
语音能力再突破!讯飞星火语音大模型即将发布
...于去年8月15日如期迎来V2.0版本,对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度升级,其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日,在第六届世...……更多
Hailo获1.2亿美元新融资,首发AI加速器Hailo-10,助力边缘设备实现生成式人工智能
...速器,以出色的低功耗性能处理大型语言模型(LLM),成功将生成式人工智能技术引入边缘计算领域,为行业发展注入新动力。边缘人工智能处理器的领先芯片制造商Hailo近日宣布C轮融资再获1.2亿美元投资。与此同时,Hailo还推出创新型H...……更多
多个中国团队斩获EMNLP\'24最佳论文!UCLA华人学者中三篇杰出论文
...语言,跨文化再创作应运而生。作者构建了三个包含SOTA生成模型的管道:e2e-instruct 直接编辑图像,cap-edit 通过字幕和 LLM 编辑后处理图像,cap-retrieve 利用编辑后的字幕检索图像,还创建了概念和应用两部分评估数据集。 结果...……更多
Meta推出AI新模型VFusion3D,微美全息布局AIGC+3D内容加速产业转型升级
...,Meta(META.US)和牛津大学的研究人员开发了一种新的3D生成式AI模型VFusion3D,能够从单张图像或文本描述生成高质量的3D对象,可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉,VFusion3D界面简单直观,允...……更多
新闻传播业的生成式人工智能应用及其风险应对
...伪造滥用,探究“AI治理AI”新模式,坚持人本主义,是生成式人工智能风险治理的关键。人工智能的创新应用形塑社会互动模式。在信息传播、医疗、交通、教育等场景中,人工智能成为社会互动的代理,促使人与人的互动越...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...了 LoCoVQA,一种带有干扰项的长上下文视觉问答 (VQA) 基准生成器。LoCoVQA可以提供与问题相关的图像序列,以及一组可配置的视觉干扰项,从而准确评估VLM如何在杂乱的上下文中仅提取与查询相关的信息。从原理上讲,这也是一...……更多
Sora刷屏 标贝科技AI配音为音视频内容创作插上翅膀
...一枚重磅炸弹——发布文生视频模型 Sora。作为一款全新生成式人工智能模型, Sora能够根据文本指令创造出既逼真又富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。从OpenAI 官网展示的众多案例我们可...……更多
Adobe将Firefly引入Vision Pro头显
...ITBEAR科技资讯】2月3日消息,Adobe公司近日宣布,其主流生成式人工智能应用程序Firefly将正式登陆VisionPro头显平台,并在2024年3月1日前提供免费使用服务。这一举措被视为Adobe在创意生成人工智能领域的又一重要布局。据ITBEAR科...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...成为金山办公布局海外业务的新节点。“今天我们来到了生成式 AI 的时代。”近日,金山办公全球业务副总经理张宁在接受记者采访,谈到协同办公软件发展时认为,移动互联网时代让我们看到了应用软件的百花齐放,如今,...……更多
中国首个音乐SOTA模型「天工音乐大模型」今日公测
...技术领域取得突破,带来产业全面变革。然而,在AI音乐生成领域,全球迟迟等不到一款产品,开启「音乐ChatGPT时刻」。这是因为一直以来,AI音乐行业大量研究都集中在符号音乐生成技术路线上,并且大多只能实现无人声背景...……更多
OpenAI劲敌来了!这款大模型多项测试超越GPT-4o,号称最强智能
...差别、幽默和复杂指令方面的表现有显著的提升,并能在生成内容时使用更自然的语气。在内部代理编码评估中,3.5 Sonnet解决了64%的问题,而Opus此前的成绩是38%。3.5 Sonnet超越前代Opus。来源:Anthropic此外,Claude 3.5 Sonnet模型具备...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00