• 我的订阅
  • 头条热搜
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
200余位顶尖学者和产业专家共议人工智能热点问题
...源研究院院长王仲远介绍了智源研究院在语言大模型、多模态大模型、具身大模型和生物计算大模型的前沿探索和研究进展,以及大模型全栈开源技术基座的迭代升级与版图布局。王仲远表示,未来,大模型将以数字智能体的形...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
创新工场李开复:AI 2.0已至,将诞生新平台并重写所有应用
...的重大突破之后,AI 已经来到从 1.0 迈入 2.0 的拐点。多模态、巨型数据集的飞速发展,AI 优化目标函数及训练模型的技术方法将大幅精进,能更好地模拟人类的认知智能。此外,AI 2.0 将会带来平台式的变革,改写用户的入口和...……更多
错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
...称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该...……更多
2023IDEA大会:让大模型更好应对复杂问题
...机视觉领域在呼唤通用大模型的来临。以GPT-4V为代表的多模态大模型,是在语言能力上增加视觉能力;IDEA研究院的计算机视觉团队则选择了另一条路径,先将基础的视觉能力做到极致,再增加语言能力。目前风靡全球的“大模...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
中国最接近GPT3.5的团队 默默无闻的驻扎在西湖边
...情感感知和主动聊天的特色。凭借着顶流的技术团队、多模态的技术优势,这个默默无闻的低调企业,不仅打造了国内极少数能与GPT-3.5一较高下的大模型,还多次赢得了360周鸿祎、美团王慧文的青睐。如今,汤姆猫将成为西湖...……更多
周睿:起跑要趁早
...自动驾驶、机器人等领域。迄今,周睿已经发表了多篇多模态AI研究和机器人领域的论文。读大一期间,周睿还到苹果公司实习。在那里,他见识到了硅谷顶尖的公司团队之间是怎么合作的,包括他们的工作方式——怎么创造产...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
京东要给实体产业做个GPT
...测试,都会为AI带来点滴新的进步。决战大模型:走向多模态与实体京东云今年将发布的新一代产业大模型 ——言犀大规模预训练语言模型,被视为是AI角逐产业场景的开端。京东云言犀团队前后耗费多年时间,持续深耕对话式A...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...张一天等人重新审视了色调变换这一操作在视频数据这一模态下的作用,并观察到了完全相反的现象,即这种操作能让视频理解模型的性能和泛化性得到提升。通过进一步地分析其在不同模态数据下(图像/视频)表现差异的原...……更多
【科技早报】OpenAI 发布多模态预训练大模型 GPT-4;微软将推进1万人裁员计划
...1000亿元机器人关联产业规模。【大厂要闻】OpenAI 发布多模态预训练大模型 GPT-4。今日凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。据悉,GPT-4 实现了以下几个方面的飞跃式提升:强大的识图能力;文字输入限制提升至 2.5 万字...……更多
BAT等互联网大厂,如何入局人形机器人?
...智能公司,其研制的文心产业级知识增强大模型,具备跨模态、跨语言的深度语义理解与生成能力,百度认为,大模型等人工智能工具,核心在于提高效率,因此在上一次机器人发展浪潮中,百度就尝试通过飞桨深度学习平台和...……更多
“黄埔星”大模型发布!第三届粤港澳大湾区(黄埔)国际算法算例大赛启动
...创新,聚集力量推进“黄埔星”大模型成为国内领先的多模态基础大模型,在全国范围内征集选拔优秀单点技术,实现大模型在领域赋能上快速突破。广州市黄埔区政府一级调研员杨家伟表示,大赛在聚集人才、攻关科研及产业...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解释、自我评测和自我监督,构建...……更多
李开复:中国大模型与美国顶尖差距从7年缩短至6个月
...赢”的程度,零一万物就会转向国外市场。中国大模型与美国顶尖差距从7年缩短至6个月?自ChatGPT横空出世引发国内外的大模型创业浪潮以来,有不少创业者通过各种大模型榜单来证明自己大模型产品的能力,但是各类榜单鱼龙...……更多
AIGC按下昆仑万维的全球化加速度
...yText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,标志着昆仑万维成为目前国内AIGC领域布局最为全面的公司之一,也是国内第一个全身心投入到AIGC开源社区的公司。有意思的是,昆仑天工起先源于规...……更多
AI视野:iPhone16将引入生成式AI;百度AI编程工具限时免费;
...演模式。????‍????????????聚焦开发者清华系ChatGLM3发布,多模态挑战GPT-4V智谱AI发布了清华系ChatGLM3,全自研、适配国产芯片,多模态模型挑战GPT-4V,搭载国产Code Interpreter,实现代码交互能力。元象大模型向全社会开放元象信息科...……更多
深度学习不是AI的终极答案
...句润色、归纳总结等简单的重复性文案工作。此外,在多模态人工智能中,我们可能会看到更多新的应用场景。例如与图像识别、图像生成相结合的大型语言模型,可能会在AR领域发挥作用;基于大模型的视频内容理解,可以利...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
...家点评GPT-4:数学不太好的文科生业内人士如何看待这个多模态预训练大语言模型?记者采访了上海交通大学教授、自然语言处理专家赵海。“读图编程”表演令人惊艳赵海教授解释,模态对应的是人类感知类型,包括文本、图像、声...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模...……更多
以假乱真,天工音乐大模型带来颠覆式AI体验
...、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
文|武静静编辑|邓咏仪36氪获悉,多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方...……更多
“世界模拟器”的文化偏见与AIGC时代的文化竞争
...的技术突破确实为内容生产提供了几乎无限的可能性。多模态视频生成与新的世界模拟器2023年ChatGPT的出世吸引了全球对新一代生成式AI的注意力,确立了大语言模型作为新一代内容生成技术的重要基础地位。大语言模型特别强...……更多
AI大牛杨红霞离职创业,曾为字节和阿里大模型研发主力 | Long China 50独家
...入字节的消息。此前,杨红霞担任阿里达摩院超大规模多模态预训练模型M6的技术负责人,是M6大模型从百亿、千亿参数量进化到万亿规模的主要功臣。2022年9月,杨红霞因个人家庭原因离开了达摩院。2023年初,ChatGPT在国内卷起...……更多
更多关于科技的资讯:
和声共鸣,创新交响:一睹2024中国国际乐器展览会的多维魅力
2024第三十一届中国国际乐器展览会展已经盛装开幕。本次展会在中国国际展览中心(朝阳馆)举办。6月27日——6月30日
2024-06-28 17:31:00
小米集团CMO许斐被抖音识别为AI生成:直呼把我整不会了
快科技6月28日消息,今日,小米集团CMO许斐发微博称,自己发的视频内容被抖音判定“疑似AI生成,请谨慎鉴别”,直呼“把我整不会了”
2024-06-28 17:09:00
NASA公布宇宙“创生之柱”新影像:哈勃、韦布合力拍摄 距离地球6500光年
快科技6月28日消息,美国国家航空航天局(NASA)今天在社交平台发布了“创生之柱”全新三维可视化影像,让公众可以在可见光和红外光下360度全方位观察这一天文奇观
2024-06-28 17:39:00
巴南高铁开通运营:全长149公里 成都至巴中最快136分钟
快科技6月28日消息,据媒体报道,备受瞩目的新建汉中至巴中至南充铁路巴中至南充段(简称“巴南高铁”)正式开通运营,标志着巴中正式迈入“高铁时代”
2024-06-28 17:09:00
蜜雪冰城回应新品被吐槽有一股脚味:独特气味 糯米清香
快科技6月28日消息,日前,蜜雪冰城推出的糯香茶系列因味道引发关注,相关话题登上热搜。据了解,事情起因是该系列的“糯香柠檬茶”被部分网友吐槽有股又臭又酸的脚臭味
2024-06-28 17:09:00
国内最大游戏博物馆落户上海:7月下旬开馆试运营
快科技6月28日消息,中国音像与数字出版协会今天正式宣布,中国音数协游戏博物馆落户上海,并将于2024年7月下旬开馆试运营
2024-06-28 17:09:00
丰田5月海外销量创新高:但国人不买账 中国区销量大跌14%
快科技6月28日消息,据报道,丰田汽车日前公布了5月份产销和出口数据;包括雷克萨斯在内,丰田5月份全球销量84万辆,同比有所上涨
2024-06-28 17:09:00
华为:F5G-A宽带从千兆迈向万兆 助力运营商实现三大跨越
快科技6月28日消息,在2024上海世界移动通信大会期间,以“全光万兆,品质运力,共筑智能世界”为主题的F5G-A全光万兆产业峰会举办
2024-06-28 17:39:00
高考600分女生3年用上千根笔芯:这些笔芯见证了她三年的努力
6月28日消息,据国内多家媒体报道,一位母亲在短视频平台上晒出了女儿高中三年用掉的1000多根笔芯。她说,女儿高考600分
2024-06-28 17:39:00
九识智能四款L4级无人车重磅发布,构建城市物流全场景解决方案
6月28日,全球自动驾驶产品研发和应用的领军企业九识智能在苏州举行“九识无人车2024新品发布会”。此次发布会上,九识智能重磅推出具有革命性的城市低速全场景城配解决方案--四款覆盖不同场景的L4级无人车Z2
2024-06-28 17:46:00
一加中国区总裁李杰:受芯片等成本上升影响,接下来手机厂商或集体涨价
出品 | 搜狐科技作者 | 张雅婷6月28日消息,在昨天的夏季新品发布会上,一加正式发布一加 Ace 3 Pro、一加平板 Pro
2024-06-28 17:49:00
鸿蒙智行:AEB本质是辅助驾驶安全功能、不能完全规避所有碰撞
快科技6月28日消息,随着智能驾驶的逐步普及,围绕着它也出现了各种各样的热议话题,其中AEB无疑被炒得非常火热,有人甚至认为
2024-06-28 18:09:00
曾被吐槽软件套娃收费坑死人!WPS突然崩了:官方回应
快科技6月28日消息,就在刚刚,有不少网友反馈,WPS崩了。6月28日,不少网友反映,WPS崩了,金山文档打不开。随后
2024-06-28 18:09:00
21999元性能怪兽!微星泰坦18 Pro锐龙版2024上架:锐龙9 7945HX3D+RTX 4090
快科技6月28日消息,微星泰坦18 Pro锐龙版2024笔记本在京东上架,搭载AMD锐龙9 7945HX3D处理器,NVIDIA RTX 4090显卡
2024-06-28 18:09:00
深圳北站可以打飞的了!包机9800元起:可坐6人
快科技6月28日消息,今天上午,深铁集团携手东部通航合作共建的中国首个“低空+轨道”空铁联运项目在深圳北站枢纽东广场正式开航
2024-06-28 18:09:00