• 我的订阅
  • 头条热搜
谷歌deepmind公布ai模型训练法
...学能力更强的AI模型。谷歌DeepMind使用PaLM2模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...模型与相似的体积大 10 倍的模型相比具有显著竞争力。研究人员使用分类目标预训练的视觉变换器(ViT)模型与对比性预训练的模型(SigLIP)进行了比较,结果发现,PaLI-3 虽然在标准图像分类基准上略微表现不佳,但基于 SigLIP...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...中均包含“screencap”。 (图片来源:IEEE Spectrum)大语言模型(LLM)在多大程度上“记住”了其训练输入内容是一直以来广受关注的问题。而最近的实证研究表明,大语言模型在某些情况下的确可以重现或者生成只包含细小差别...……更多
深度势能核心开发者团队发布“大原子模型计划”
...制药等领域工业微尺度设计的变革。OpenLAM计划希望未来研究人员可以一键获取任意元素组合体系的势能函数,极大地简化获取精确模型的过程,不再需要生成大量新的第一性原理计算数据,以及进一步拥有结构搜索、结构生成...……更多
亚马逊开发史上最大文本转语音模型
...,该模型拥有最多的参数,并使用了最大的训练数据集。研究人员已经在arXiv预印本服务器上发表了一篇论文,详细描述了模型的开发和训练过程。近年来,像ChatGPT这样的“大型语言模型”凭借其智能回答问题和生成高级文本的...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...大模型时代,技术演进有两股主要的驱动力量,一方面是研究人员对通用人工智能的追求和对尺度定律(Scaling Law)的信仰,从而不断突破边界,寻求接近通用人工智能的道路。另一方面,产业界也看到了大模型带来产业革命的...……更多
丹麦用全民数据训练AI!预测35岁至65岁4年后的个体死亡:准确率达78%
...机器学习算法的出现。”利用丹麦国家登记册中的信息,研究人员将几乎丹麦全国约600万公民的逾十年的生活信息——包括收入、职业、居住地、受伤情况、工作时间、医院就诊及诊断等细节,甚至包括怀孕史等——转化为一种...……更多
开放模型权重被指将导致AI失控,Meta遭举牌抗议
...意识和科学发展产生严重的不良后果,特别是会影响独立研究人员。」尽管大家已经在讨论开源带来的影响,但 Meta 的方法是否真的足够开放,是否能够发挥开源的优势,还未可知。开放源代码促进会(OSI)执行董事 Stefano Mafful...……更多
...程中产生的假象,并认为创新能力的增强是循序渐进的。研究人员近日在美国新奥尔良举行的神经信息处理系统大会(NeurIPS)机器学习会议上报告了这项工作。“我认为他们在说‘没有什么神奇的事情发生’方面做得很好。”...……更多
ChatGPT一周年,机会在大厂还是小公司?
大创新靠小厂、小创新靠大厂。大厂的体量也会有大模型,只要增加1%就是巨大的受益。但是最大的创新可能来自于创业公司。新的一波机会,从信息时代走向智能时代,会有新的公司起来。作者|尹凯编辑|原野ChatGPT 会成为AI大...……更多
斯坦福发布ai基础模型“透明度指标”
...标最高的是Meta的Lama2,但相关“透明度”也只有54%,因此研究人员认为,市面上几乎所有AI模型,都“缺乏透明度”。据悉,这一研究是由HAI基础模型研究中心(CRFM)的负责人RishiBommasani所主导,调查了海外最流行的10款基础模...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
谷歌公开“社会学习”ai框架
...特定任务解法的“教师模型”学习各种问题的解决方案,研究人员设计了“垃圾短信检测”、“解决小学数学问题”、“根据特定文字回答问题”等多项测试,来评估相关“社会学习”框架的成效。研究人员表示,部分AI模型只...……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...识别视觉上不同但编码相似的图像。为了解决这个问题,研究人员提出了“交错特征混合(Interleaved-MoF)”方法,该方法结合了CLIP和DINOv2特征,显著增强了视觉基础能力。在MMVP基准测试中,这种方法实现了10.7%的性能提升,同...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
2024-02-04 10:57:47 作者:姚立伟2月4日消息,研究人员发现网络上的大量内容都经过机器翻译(MT)的处理,且翻译质量普遍较低。这一现象引发了对训练大型语言模型时数据来源考量的重要性的关注。研究团队开发了一项名为“...……更多
...资源,而他们需要更多、更大规模的数据来训练更强大的模型。为了处理这个问题,OpenAI的Whisper语音识别工具诞生了——用来转录谷歌旗下视频平台Youtube的视频音频,生成大量的对话文本。报道称,包括OpenAI总裁布洛克曼在内...……更多
马斯克承诺开源版大模型 来了!Grok-1:3140亿参数迄今最大,权重架构全开放
...之心开源社区有福了。说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型‘Grok-1’,以及该模型的权重和网络架构。这也使得Grok-1成为当...……更多
...绩能排进前10%)。马塞利诺说,这个领域还在不断发展。研究人员正在寻找方法来构建更小、更灵活的模型,利用ChatGPT的潜力,将该工具应用于医学、军事等领域。然而,生成式人工智能程序可能带来的潜在好处往往被不断增加...……更多
第一级将包括所有基础模型;第二级针对“非常强大”的基础模型,将通过用于训练其大型语言模型的算力来区分;第三级被称为大规模通用目的人工智能系统,将包括最流行的人工智能工具,并以用户总数来衡量。欧盟正在...……更多
智谱AI CEO张鹏:智谱AI的GLM-130B是达到世界靠前水平的自主研发产品
...央视网、小央视频视频号以及智谱AI视频号同步直播。大模型(人工智能)三个阶段首先,智谱AI的CEO张鹏向大家回归了大模型(人工智能)三个阶段:从2017年谷歌提出Transformer开始迅速席卷了整个人工智能领域的研究和产业,...……更多
OpenAI没有放弃的机器人梦想
...灵巧的机器人动作能力。 为了实现视频中的效果,Figure研究人员将机器人摄像头捕获的图像和机载麦克风捕捉到的语音转录文本,输入到一个由OpenAI训练的大型多模态模型中,然后由该模型处理对话的整个历史记录,得出语言...……更多
Sora为何没能诞生在中国?
...家AI初创公司Pika lab(以下简称Pika),推出自研视频生成模型的新功能,可同时生成画面和声音。此前,人们看到的所有AI生成的视频都没有声音。此功能尚未向公众开放,但足以让人见识到AI的进化之快。今年2月16日,OpenAI发布...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...升大模型对中文指令的理解和响应能力。在AI训练之余,研究人员也好奇地测验了下不同平台的数据质量,获得下图跑分。其中,“Ruozhiba(弱智吧)”数据集在头脑风暴、分类、生成、总结等八个评测项目中夺得最高分,且总...……更多
meta推出“v-jepa”视频预测模型
...高效预测生成图片/视频中被遮蔽的部分。IT之家注意到,研究人员使用一系列经过遮蔽处理的特定视频训练I-JEPA/V-JEPA模型,研究人员要求模型利用“抽象方式”填充视频中缺失的内容,从而让模型在填充间学习场景,进一步预...……更多
麻省理工学院联合metaai开发streamingllm框架
10月6日消息,麻省理工学院联合MetaAI的研究人员日前开发了一款名为StreamingLLM的框架,为大语言模型可能遇到的RAM与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。▲图源GitHubStreamingLLM的...……更多
金融大模型观察 财联社12月9日讯(研究员张玉虹 记者郭松峤)ChatGPT发布一周年之际,AI大模型的讨论热潮仍旧方兴未艾。在ChatGPT的推动下,国内的大模型企业亦从探索和尝试渐进深水区。在国内“百模大战”中,有关垂直行...……更多
马斯克要求OpenAI恢复开源,背后是开源闭源路线之争
...ieWang对记者表示,“不同的态度取决于不同的身份。学术研究人员希望AI技术是开源的,以便可以评估和修改代码。另一方面,企业家可能为了保护投资和业务,而不愿意开放源代码。”科技巨头与AI新贵在开源或闭源的问题上...……更多
谷歌DeepMind展示大模型Genie,能从零制作类似超级马里奥的游戏
...看他们造出了什么。”他说。虚拟游乐场谷歌 DeepMind 的研究人员感兴趣的不仅仅是游戏生成。Genie 背后的团队致力于研究开放式学习,将人工智能控制的机器人放入虚拟环境中,通过试错(一种被称为强化学习的技术)来解决...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...博士生方俊峰和所在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 4000000 多个分……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...歌猛进,苹果显得很是安静,尤其苹果和哥伦比亚大学的研究人员于在 2023 年 10 月低调发布的一个名为 Ferret 的开源多模态大模型也没有收到太多关注。当时,该版本包含代码和权重,但仅供研究使用,而非商业许可。但随着 Mi...……更多
更多关于科技的资讯:
中宝电缆全力以赴迎战台风“摩羯”
众志成城战“摩羯”,筑牢安全“堡垒”。今年9月5日第11号台风“摩羯”成为建国以来登陆我国的最强秋台风,“摩羯”在超强台风级别维持时间长达64小时
2024-09-13 18:45:00
韩国宝马集团推出全球首个休息室式电动汽车充电站
CNMO从韩媒获悉,韩国宝马集团近日在首尔站前推出了全球首个休息室式电动汽车充电站“BMWChargingHubLounge”
2024-09-13 18:46:00
下载量5000w的折磨流游戏,在最火的时候下架!相隔10年宣布回归
游戏存在的目的是为了娱乐大众,对于这一点相信绝大部分玩家都会认可。但不知道从何时起,一些风格奇怪的游戏作品开始涌现,在体验它们的过程中
2024-09-13 21:02:00
根源不治,慢病难除——介绍功能医学根源体检
慢病蔓延,迁延不愈,个人痛苦,家人难过。原因就是疾病根源不治,则慢病难除。功能医学以标本兼治的理念和循证科学的方法快速弥补医疗健康行业的不足
2024-09-13 18:51:00
口服衰老抑制剂瑞维拓(Revigorator)的成功证明:“衰老干预”值得下“硬功夫”。这款集合了哈佛NAD+和梅奥希诺裂等先进衰老干预技术的原研产品
2024-09-13 18:52:00
壁仞科技正式启动a股ipo进程
9月13日,据报道,壁仞科技(Biren)已经聘请国泰君安证券作为其上市辅导机构,筹备在科创板进行首次公开发行股票。值得注意的是
2024-09-13 19:39:00
rogxg显卡扩展坞在拼多多百亿补贴上架
近日,ROGXG4090显卡拓展坞在拼多多百亿补贴上架销售,售价8949元。该拓展坞适用于笔记本、ROG掌机等设备。官方介绍指出
2024-09-13 19:55:00
HX200移动固态硬盘售价约为1283.78元人民币
HX200采用金属材质外壳,具有抗振动、抗跌落等优势,在复杂的户外环境中表现出色。其尺寸为三维65×43×11mm,重量为67g
2024-09-13 19:56:00
迎接916“国际臭氧层保护日”京东“青绿计划”推出 “减碳特权”
为迎接即将到来的916“国际臭氧层保护日”,推广绿色低碳生活方式,京东“青绿计划”宣布联合Apple、罗技等多家品牌升级碳账户
2024-09-13 19:56:00
卢伟冰:小米手环9是一款值得推荐的智能穿戴设备
9月13日,卢伟冰在社交媒体上表示了许多人询问他为何一直钟爱小米手环9。他的需求其实很简单:希望手表能方便显示时间、计步数和徒步记录的里程
2024-09-13 20:07:00
一直以来,顺丰始终将小哥作为核心竞争力,持续保持一二线员工薪酬竞争力,充分保障员工权益,并结合丰富的激励机制促进小哥积极开拓业务
2024-09-13 20:11:00
2024年服贸会期间,一款乒乓球机器人吸引不少人驻足。现场工作人员接受中新经纬采访表示,正在展示的是手臂型乒乓球发球机器人
2024-09-13 20:17:00
2024年服贸会有什么亮点?在中药展区,最吸引小编的是机器人把脉看病,能做到“望闻问切”。来源:中新经纬编辑:万可义广告等商务合作,请点击这里未经过正式授权严禁转载本文,侵权必究
2024-09-13 20:22:00
广颖电通cfexpress4.0typeb存储卡发布
广颖电通近日发布了StudioPro系列CFexpress4.0TypeB存储卡。这批存储卡支持4K和8K高分辨率视频录制以及连拍功能
2024-09-13 20:22:00
苹果visionpro新型攻击手法曝光
近日,安全研究人员成功发现了一种针对苹果VisionPro的新型攻击手法——GAZEploit。该方法利用用户在视频通话期间虚拟头像Persona的眼球运动来破解其密码
2024-09-13 20:29:00