• 我的订阅
  • 头条热搜
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...相似的面部动作。传统方法通常会额外训练一个说话风格编码器,但是由于模型内部信息瓶颈的存在通常会性能损失。与之相比,受启发大语言模型、语音合成等领域的启发,MimicTalk 首次提出从上下文中学习目标人说话风格的...……更多
浙江方德取得同时检测输入输出转速的磁编码器布置结构专利,大大减小检测装置占用空间
...有限公司取得一项名为“一种同时检测输入输出转速的磁编码器布置结构”的专利,授权公告号CN222802698U,申请日期为2024年6月。专利摘要显示,本实用新型涉及一种同时检测输入输出转速的磁编码器布置结构,包括电机、谐波...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...arge 2进行扩展1230亿参数的多模态解码器,10亿参数的视觉编码器128K上下文窗口长度:可容纳至少30张高分辨率图像具体来说,Pixtral Large是Mistral多模态系列的第二个模型,基于Mistral Large 2构建,有1240亿参数。该模型能够理解文档...……更多
WAIC 2025:开普勒大黄蜂挑战8小时直播圆满收官,引领具身智能商业化新征程
...,发挥着类似人类肌肉的作用。其集成了丝杠、减速器、编码器等部件,采用多线接触的设计,比传统滚珠丝杠承载能力更高、刚性更强,这令K2大黄蜂适用于重载、高速的工况。 工业场景的另一个普遍需求是精准操作,这考...……更多
宁波市鄞州华本电主轴科技取得一种同步电主轴专利,有助于消除主轴本体由于位置回转误差引起的加工精度损失
...的前端盖本体以及后端盖,所述前端盖本体的顶端固定有编码器方形安装盒,所述外轴筒的内部转动安装有主轴本体,所述前端盖本体、编码器方形安装盒的内部腔体空间相互连通,所述编码器方形安装盒的顶端栓接有上密封盖...……更多
stabilityai推出stableaudioopen
...音效,该开源模型基于transforms扩散模型(DiT),在自动编码器的潜在空间中操作,提高生成音频的质量和多样性。StableAudioOpen目前已经开源,IT之家附上相关链接,感兴趣的用户可以在HuggingFace上试用。据说它使用了来自FreeSound...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...器人仿真器,生成特定的房屋布局和结构- 我们认为视觉编码器是当前LLM的瓶颈,尤其是对于抽象图表而言,因此未来提升编码器图像分辨率可以增强LLM的细粒度认知能力参考资料:https://the-decoder.com/study-reveals-major-weaknesses-in-ais.……更多
2G弱网也能开会、语音!腾讯用AI技术给实时音频传输“动刀”
...供了新的性能上界,从而对下一代通信系统,尤其是信源编码器部分,提供了新的技术基础和方法论。通过AI语音信号建模,提取最核心的特征参数编码,再借助深度学习网络,预测并重建语音中的细微结构,最终生成逼真的音...……更多
新华医疗获得发明专利授权:“装盘系统”
...了一种装盘系统,包括电磁离合器、装盘驱动装置、追踪编码器和安装架,所述装盘驱动装置包括旋转驱动部;所述电磁离合器包括与所述旋转驱动部固定连接的第一离合器片和与所述追踪编码器固定连接的第二离合器片,所述...……更多
平宝公司全省率先开启智能化采煤3.0模式
...能大师、该公司综采一队职工张工厂说。3.0系统利用位置编码器、射频定位技术和惯性导航技术,实现采煤机三维坐标精确定位,使工作面刮板输送机自动找直、调直;在智能化采煤3.0模式下,还首次应用了防爆轨道巡检机器人...……更多
阿里巴巴推出atomovideo高保真图生视频框架
3月7日消息,阿里巴巴研究团队近日推出了AtomoVideo高保真图生视频(I2V,ImagetoVideo)框架,旨在从静态图像生成高质量的视频内容,并与各种文生图(T2I)模型兼容。▲图源AtomoVIdeo团队论文IT之家总结AtomoVideo特性如下:高保真...……更多
腾讯实时语音编码大突破:电梯、地库里通话也不卡顿
...信号处理和最新的深度学习技术结合在一起,突破了传统编码器的天花板。多方测试表明,腾讯提交的AVS3P10,代表了目前AI Codec(人工智能编解码器)的行业最高水平。它可以实现码率(每秒钟传输的音频数据量)6kbps以下的高...……更多
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
...L2 模型支持动态分辨率,仅使用一个 SigLIP-SO400M 作为图像编码器,通过将图像切分为多张子图和一张全局缩略图来实现动态分辨率图像支持。这一策略让 DeepSeek-VL2 最多支持 1152x1152 的分辨率和 1:9 或 9:1 的极端长宽比,适配更多...……更多
昆山博胜兴取得扭力检测机构专利,本机构可搭配车床进行使用
...述动力马达输出端固定安装轴杆一,所述轴杆一上安装有编码器机构和扭力传感器,所述扭力传感器设置在编码器机构左端,所述轴杆一左端安装万向连接轴装置,所述万向连接轴装置左端安装有轴杆二,所述轴杆二左端安装有...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...进行微调,增强文本特征更具区分力,进而作为 CLIP 视觉编码器的强力 「教师」。这种设计让 LLM 中的文本理解力被有效提取,CLIP 在各种跨模态任务中获得显著性能提升。实验结果表明,LLM2CLIP 甚至能在不增加大规模训练数据...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
今天,世界见证了 RDT 大模型的诞生,它就像 “小脑” 一样负责控制机器人的运动。同行看后纷纷表示:有了十亿参数的 RDT ,智能机器人时代不远矣!去酒吧点 RDT 调酒师,赛博朋克感瞬间拉满。在领略了 RDT 的强大后,是时...……更多
...及部件,多次与不同加油机生产厂家沟通,与生产加油机编码器的厂家联系,并与加油机检定机构协调,创新检查方法,配备专业检测设备等,多途径、多手段、多方法检查加油机计量作弊违法行为。据介绍,编码器是加油机的...……更多
RTX 4070Ti正式公布!799美元、性能超RTX 30
...刷新率1440p显示器发挥到极致,视频编辑则希望通过双AV1编码器缩短渲染时间。GeForceRTX4070Ti为GeForceGTX1080Ti或GeForceRTX2080用户带来巨大升级。结合DLSS3技术,GeForceRTX4070Ti与传奇的GeForceGTX1080Ti相比,提……更多
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
...VQVAE,在token上训练VAR Transformer。第一阶段,多尺度VQ自动编码器将图像编码为K个token映射R=(r_1,r_2,…,r_K),并通过复合损失函数进行训练。第二阶段,通过下一尺度预测对VAR Transformer进行训练:它以低分辨率token映射 ([s],r……更多
听得懂、看得见、找得到!理想汽车下一代自动驾驶架构MindVLA亮相
...找得到。该技术基于端到端和VLM双系统架构,通过3D空间编码器和逻辑推理生成合理的驾驶决策,并利用扩散模型优化驾驶轨迹,整个过程需在车端实时运行。 MindVLA采用3D高斯作为中间表征,利用海量数据进行自监督训练,显...……更多
理想的智能驾驶,到底「City 不 City」?
...时,理想还设计了能够缓存更长时序视觉数据的流式视频编码器、增加了能够缓存多帧历史信息的记忆模块以及智能驾驶 Prompt 提示库。 理想的 VLM 视觉语言模型参数量达到了 22 亿,具备更强的逻辑思考能力,能够对物理世界...……更多
比Stable Diffusion便宜118倍!1890美元训出11.6亿参数高质量文生图模型
...。模型前端使用Stable-Diffusion-XL模型中的四通道变分自动编码器(VAE)来提取图像特征,另外还测试了最新的16通道VAE在大规模训练(省钱版)中的性能。 作者使用EDM框架作为所有扩散模型的统一训练设置,使用FID以及CLIP分数来...……更多
陕西润泽博泽申请注塑件表面质量检测专利,提高模型检测准确率
...,生成高斯分布作为图像标签。将高斯分布引入预设网络编码器,并通过加权融合的方式将高斯分布与中间特征图进行融合。利用上一个完整训练周期内的损失函数值作为调控因子,结合正弦函数的周期性对融合系数进行修正,...……更多
天津新松智能申请一体式洁净机器人控制器专利,提高生产效率
...板间通过高速板对板连接器进行数据交互,载板上连接有编码器、驱动器接口板、安全接口板和风扇,核心板与驱动器接口板通过连接器连接,驱动器接口板连接驱动器,CPLD把解析的编码器数据通过CH368L传输至核心板,编码器...……更多
谷歌发布了3个新的开源Gemma人工智能模型
...奇怪的结果来解释他们的输出。而Gemma Scope使用了稀疏自编码器,开发者可以通过“缩小特定点到模型中的部分,并使其内部运作更易于解释”。现在谷歌的新模型已经发布。Gemma 22B和ShieldGemma都已经能够从谷歌下载。 ……更多
高能技巧!60 行 NumPy 代码 从头实现一个 GPT
...一次生成一个指令。3、main( )主函数处理:加载标记器(编码器)、模型权重(参数)和超参数(hparam)使用 tokenizer 将输入提示编码为指令 ID调用生成函数将输出 ID 解码为字符串4、fire.fire(main)只是将我们的文件转换成一个 C...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...架如下图所示,是基于多个专家Transformer模块,通过文本编码器将输入的文本转化为潜在向量,再经由3D卷积和多层专家模块处理,生成连续的视频序列。整个过程可视为将自然语言描述转化为动态视觉内容的复杂系统。在模型...……更多
win11自带播放器出乎意料,5个字形容“强悍又省电”
即使现在可以在网上直接看视频,但是很多朋友依旧喜欢下载视频,在本地观看。毕竟下载之后,就可以随意拖动观看,妈妈再也不用担心我网卡了。但是本地观看,需要搭配出色的本地视频播放器,因此有很多人会选择PotPlaye...……更多
从云栖大会,看阿里的科技本色
...办。今年,在 AI 技术火热的背景下,此次云栖大会上,阿里巴巴宣布了自研大模型的最新进展——千亿级参数规模的通义千问 2.0 正式发布。阿里巴巴宣布,通义千问 2.0 在 10 个权威测评中全面超越 GPT-3.5 和 Llama2。阿里还是国...……更多
更多关于科技的资讯:
“直播+平台+跨境”生态加速“杭州智造”货通全球杭州日报讯 近日,杭州综试区全球跨境电商产业基地在滨江阿里中心正式启动
2025-12-11 06:40:00
杭州具身智能机器人“加速起跑”
与未来共舞从图纸到现实,外骨骼机器人成为人类好帮手。患者使用外骨骼机器人进行康复训练。杭州日报讯 具身智能,正从实验室快速走向产业化
2025-12-11 07:11:00
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(五):关键设备共享为宁晋线缆带来什么
关键设备共享为宁晋线缆带来什么——河北特色产业集群共享智造故事(五)11月26日,位于宁晋县的缆芯高导(河北)科技有限公司共享车间
2025-12-10 08:07:00
厦门网讯(厦门日报记者 吴晓菁 通讯员 许佳琦 杨怡婷)昨日,厦门空港元翔货站跨境电商出口区一片忙碌景象,一辆辆满载货物的叉车来回穿梭
2025-12-10 08:38:00
警惕伪装成办公文件的木马病毒窃密 国家安全机关提示
中国网12月10日讯 据国家安全部微信公众号消息,国家安全部发布安全提示文章,“本月考勤公示”“年度放假安排”“高温补贴发放声明”等办公类文件
2025-12-10 08:41:00
清华、维信诺联合开发的pTSF技术破解OLED“不可能三角”,中国显示掌握关键材料主导权
屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 11:13:00
智能机器人大赛昌平收官 73支队伍四大赛道沉浸竞技 机器人实战化任务催生真实行业解决方案
本报讯(记者 张月朦)12月8日至9日,2025智能机器人大赛决赛在昌平举办。大赛设制造业类、康复养老类、安全应急类和创新类四大赛道
2025-12-10 14:14:00
研究揭示:人生黄金期在55-60岁,整体能力达顶峰
鲁网12月10日讯人们普遍认为,“年轻即巅峰”。然而,一项发表于国际权威心理学期刊《智力》的最新研究,彻底颠覆了这一传统认知
2025-12-10 16:21:00
鲁网12月10日讯山东移动临沂分公司坚决落实“以人民为中心”发展理念,强化“全心全意为人民服务”的宗旨意识,筑牢高质量发展生命线的服务方针
2025-12-10 16:24:00
潮评丨从独角兽榜单看浙江创新之势
全球独角兽企业数据库(Unicorn500)潮新闻讯 据央视新闻报道,近日,2025全球独角兽企业500强榜单发布,我国共有150家企业上榜
2025-12-10 16:24:00
大河网讯 (记者 李彤)大家好,我是水银体温计。我的时间,已经进入了倒计时。一直以来,我是每个家庭药箱里不可少的存在。我见证过无数滚烫的额头
2025-12-10 17:16:00
公益广告H5丨安全快门 快乐连拍
扫描二维码进入H5
2025-12-10 17:28:00
福州新闻网12月10日讯(记者 吴桦真)记者10日获悉,福州企业米多多集团股份有限公司正式向香港联交所递交招股说明书,拟主板上市
2025-12-10 18:02:00
大数据产业从“单点布局”迈向“生态闭环” 张家口数字经济拔节向上河北日报讯(郭晓通、王雯)“十四五”时期,张家口市把数字经济作为高质量发展的重要增长极
2025-12-10 18:34:00
QuestMobile报告:00后月活用户达1.79亿,闲鱼增速领跑移动购物行业
12月9日,第三方数据机构QuestMobile发布《2025“00后”用户消费洞察报告》,显示闲鱼00后月活跃用户规模达到4361万
2025-12-10 19:13:00