• 我的订阅
  • 头条热搜
亚马逊开发史上最大文本转语音模型
...大部分为英语语音。研究人员还向模型提供了其他语言的单词和短语示例,使其能够正确发音一些常见的表达,例如“aucontraire”和“adios,amigo”。亚马逊团队还测试了使用较小数据集的模型,希望能从中发现人工智能领域所说...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...本可以接收200万个token作为上下文。这大概相当于140万个单词、2小时视频或者22小时的音频。但不知诸位平时用得着这么长的上下文吗?毕竟100K已经相当于一部比较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?...……更多
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...和未标记的数据。大型语言模型 (LLM) 有助于理解字符、单词和文本。2017 年,Transformer 彻底改变了语言建模。Transformer 是一种神经网络,它使用注意力机制处理长期文本依赖关系。谷歌于 2017 年创建了第一个用于文本翻译的 Trans...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...大语言模型进行文本推理,最后利用语音合成系统生成并输出语音。然而,类似的多阶段串联系统存在一些缺陷,比如模型无法理解语音中包含的情绪及其它非文本内容信息;同时由于额外的语音识别及合成带来的时间开销导致...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...模型开发的预训练阶段引入了 Llama 3.1 的 8B 和 70B 模型的输出,用作训练过程中的 token 级目标。在 post-training 阶段,Meta 采用了与 Llama 3.1 相似的方法 —— 在预训练模型的基础上进行多轮对齐,其中每一轮都包括监督式微调(SFT...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...数据集训练。输入带有图像或视频的问题后,模型会自动输出一段文本作为回答。VisualGPT 是OpenAI制作的图像-文本模型,基于预训练GPT-2提出了一种新的注意力机制,来衔接不同模态之间的语义差异,无需大量图像-文本数据训练...……更多
GPT-4就是冲着赚钱来的!
...,并添加了“多模态”的图片识别功能。此外,GPT-4 将“单词最大输出限制”提高到了 25000 个单词,比基于GPT-3的ChatGPT更强大,在对问题的理解和回答方面,GPT-4也显得更聪明,更像人了。目前,ChatGPT Plus版本的用户已经可以直...……更多
再也不能用chatgpt写作业了,新算法给ai生成文本加水印
...印。如果一共有生成了N个token,所有的token都使用了白名单词汇,那么这段文字只有 2的N次方分之一概率是人类写的。即便这段文字只有25个词组成,那么水印算法也能判断出它到底是不是AI生成的。但作者也表示,水印有时候也...……更多
...视频、音频的引导下,小学生可以进行预习,对不会读的单词,多跟读几遍,对不理解的句子,多读两遍。如果还是不理解,教师会在课上组织讨论,小组里也有讨论学习的时间,学生总能够找到答案。其次,分散绘本阅读任务...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
...,价格更便宜,引入若干新的功能(如函数调用、可重复输出等)。 今年5月14日,OpenAI春季发布会,发布了新版旗舰模型GPT-4o。GPT-4o 将文本、音频和视觉集成到一个模型中,提供更快的响应时间、更好的推理能力以及在非英语...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...个词或句子进行分词,会造成被分词的语义损害。例如,单词「Classrooms」可能被分为「Class」和「rooms」,这会对分割后的单词造成语义损害。为简单起见,作者称这个问题为锯齿效应。一个非常直接的想法是采用重叠切分策略...……更多
全面透视豆包:功能、版本、价格、优势、应用
...型 tokens 单价。Tokens 定义说明:通常 1 个中文词语、英文单词、数字、符号计为 1 个 token,由于不同模型采用的分词器不同,同一段文本可能会分为不同的 tokens 数量。1. 大语言模型后付费(按tokens使用量付费)按 tokens 使用量...……更多
记者实测|速度更快成本更低,人机交互更自然,OpenAI新模型免费开放
...研究员Mark Chen表示,新模型具有“感知情绪”的能力,能输出笑声、歌唱或表达情感,还可以处理用户打断它的情况。在直播中,OpenAI演示了一段OpenAI员工与GPT-4o对话的视频,模型反应速度与人类相近,GPT-4o可利用手机摄像头描...……更多
OpenAI 开发新工具,试图解释语言模型的行为
...都可以观察文本中的某种特定模式,并影响模型下一步的输出。例如,给定一个关于超级英雄的问题(比如“哪些超级英雄有最有用的超能力?”),一个“漫威超级英雄神经元”可能会提高模型提到漫威电影中特定超级英雄的...……更多
openai回应gpt-4o升级版:非颠覆性的全新模型
...,即每次对话可处理多达128,000个标记(相当于约96,000个单词),并在输出能力上实现了显著提升,单次输出可达16,384个标记(或约12,288个单词),这一数字几乎是旧版GPT-4o的四倍。但关于ChatGPT实际性能与能力提升的具体细节,O...……更多
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...任。此类流程为:图像输入给 OCR 视觉模块,OCR 视觉模块输出图像中的字符信息并以此为上下文输入给语言模块。这样就导致了 VQA 任务退化成了不需要图像信息的 QA 任务。原本比较不同的 VLM 需要的视觉模块对齐能力被忽视而 ...……更多
常见电子邮件分类算法的性能分析
...决策树算法、多层神经网络算法来进行训练和预测,最后输出各种学习算法的计算精度、F1值、查全率等指标进行对比。 (二)代码描述首先引用sklearn等现有包中的各种方法,包括朴素贝叶斯算法、决策树算法、多层神经网络算...……更多
对比学习滥用隐私数据!中科院等发布「多步误差最小化」方法 | ACM MM2024
...决噪声最小化问题,并使用HotFlip方法来近似梯度和替换单词,以找到最佳的文本触发器。大量实验证明了方法的有效性,保护后的检索结果几乎是随机猜测的一半,并且它在不同模型之间具有高度的迁移性。本篇工作的论文和...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...组合作为输入,并实时生成文本、音频和图像的任意组合输出。如今,智谱清言的「情感语音通话」又一次推动了国产 AI 对标国际先进水平。情感语音模型 GLM-4-Voice 上线即开源自从去年的 GPT-4 发布之后,领域内就一直在传 GPT-...……更多
...了一个脑机接口,这些志愿者按要求大声说出给定的12个单词,设备会记录下他们的大脑活动信号。随后,研究人员运用先进的人工智能对志愿者的大脑活动信号进行解码,与具体的单词之间建立一一对应关系,并将信号转化为...……更多
...语言模型进行处理,得到添加有水印词的第一回复信息并输出,其中,目标指令用于指示语言模型在处理的结果中添加水印;在请求文本的类别不属于目标类别的情况下,将请求文本输入至目标语言模型进行处理,得到第二回复...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进行交互成为可能。然而,开源社区对于构建此类基于 LLM 的语音交互模型仍然缺乏探索。实现与 LLM 进行语音交互...……更多
人工智能语义解码器可以用于脑机接口技术
...实际应用。然而,目前非侵入式语言解码器只能从一小组单词或短语中来识别这些大脑的刺激。现在通过非侵入式解码器,可以从fMRI记录的皮质语义表征中重建连续语言,从而可从多个区域分别解码连续语言。得州大学奥斯汀...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...GPU小时(105-107个),并分布在多个GPU上进行。预训练的输出模型称为「基础模型」。继续预训练继续预训练(也称为第二阶段预训练)将使用全新的、未见过的领域数据进一步训练基础模型。 这里,同样使用与初始预训练相同...……更多
ChatGPT大升级:可以识别理解图像了
...的Token序列,之前的版本限制为4096个Token,大约只有8000个单词,但现在它支持32768个Token,相当于6.4万个单词或50页文本,一次对话足以完成一部剧本或者短篇小说。此外,GPT-4还支持更多的语言,扩展到了26种,回答也更加个性...……更多
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...如果输入的数据与训练数据不同,它们可能会产生错误的输出。基于上述问题,这些模型有时会做出不合逻辑的陈述,或者自信地把谎言说成事实。谷歌AI的吴宇怀表示:“我们不想创建一个像人类一样说话的语言模型,我们想...……更多
打破视觉壁垒!GPT-4发布,概念股走低,对产业有何影响?企业回应
...LP(自然语言处理)模型,但若GPT4转向多模态,未来输入输出可能出现图像、视频等形态,有望打开下游千行百业应用空间。在Open AI的发布中,GPT-4“露出庐山真面目”,它与此前的GPT系列模型相比,最大的突破之一是在文本之...……更多
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
...法访问运行文件的情况下应该如何运行代码7. 结果在代码输出中有充分标记的图表、表格或文件名;消除了为无组织或未标记的数据设计任务问题的需求8. 运行代码时结果的方差低;确保所有包含的胶囊都可以由人类验证和复现...……更多
“认知选择”或影响人类语言演化
...语言演化和生物进化存在很多相似之处。如果将语言中的单词看成是一个个有生命的有机体,那么它们想要在人类有限的认知资源(如注意力、记忆)里“生存”下去,就得“进化”出适应认知的特征,这种过程可以称为“认知...……更多
更多关于科技的资讯:
旗舰机中的续航王者!真我GT7 Pro全面评测:满电续航将近16小时
一、前言:真我GT7 Pro将性价比死磕到底 无短板体验才是真Pro提到真我品牌,令我印象最为深刻的机型,当属去年发布的真我GT5 Pro
2024-11-14 13:59:00
完美全屏+全球性能第一的国产新机发布:价格很感人!
就在今天,我们再迎来一款搭载骁龙8至尊版处理器的新机,它就是红魔10 Pro系列。和之前的所有骁龙8至尊新机不同,红魔10 Pro是首款搭载骁龙8至尊版处理器的游戏手机
2024-11-14 14:03:00
iPhone 这款新机 ,凉了!
要说苹果最让果子无语的地方,就是 iPhone 那块破电池了,既不搞快充,也不搞高密度大容量,价格还离奇的贵,也不看一下隔壁安卓就牛成什么样了
2024-11-14 14:04:00
新机激活无退换货,你中招了吗?
不是前段时间,有个朋友要找我推荐600元的手机吗?我就勉强推荐了三台手机,然后让他任意选择一个即可,没想到今天他在找我的时候已经买过了
2024-11-14 14:04:00
vivo Y300 5G新机宣传海报公布:三种配色 镜头很特别
【CNMO科技消息】继Y300 Plus 5G机型在印度首发后,vivo即将推出该系列的标准版——Y300 5G。据CNMO了解
2024-11-14 14:05:00
天津北方网讯:供热首日,在天津能源集团所属天津市热电有限公司(以下简称热电公司)六纬路智慧运营中心的电气机房里,天花板方向不时传来轻微滑轨声
2024-11-14 13:53:00
《身临极境→南极起航》:揭开极光神秘面纱|VR大空间特辑
一、《南极起航》:揭开极光神秘面纱在中国南极科考40周年的历史节点,以中国第五个南极科考站——秦岭站的建成为背景。由众信旅游集团携手央博数字平台联合打造的全球首个南极主题LBE沉浸式大空间VR探索体验——《身临极境→南极起航》
2024-11-14 14:36:00
“我们全家出行,花了近千元,你给我看假鱼?”近日,有关“如果你在大型海洋馆遇到假鲸鲨怎么办”的话题在网络上引发讨论。据报道
2024-11-14 14:36:00
从山东餐饮品牌巡礼看鲁菜振兴,凯瑞、超意兴等品牌闪耀全国舞台
鲁菜,这张蕴含深厚文化底蕴与鲜明地域特色的山东名片,在近年来餐饮市场的激烈竞争中,遭遇了来自川菜、粤菜、湘菜、徽菜等众多菜系的有力挑战
2024-11-14 14:43:00
检验技术共享|无菌医疗器械生物负载测定技术
生物负载,即初始污染菌,是指产品和(或)无菌屏障系统表面或内部存活微生物的总数。暴露于一个合理确认和精确控制的灭菌过程并不是保证产品无菌以符合其预期用途的唯一要素
2024-11-14 15:16:00
高燃!宝骊叉车助飞中国航展
近日,备受瞩目的第十五届中国国际航天展隆重开幕,众多尖端科技与国防利器在此一展风采。在这场“蓝天盛会”中,宝骊叉车以其出色的性能和稳定的表现
2024-11-14 15:23:00
Adjust 发布《2024年购物应用洞察报告》读懂购物季营销
北京,2024 年 11 月 14日 -- 领先的监测和数据分析公司Adjust今日发布《2024年购物应用洞察报告》
2024-11-14 15:25:00
浙江杭州:跨境电商销售旺
本文转自:人民网-浙江频道进口商品仓库中,工作人员正忙着检验、分拣、打包进口产品。人民网记者 郭扬摄人民网杭州11月14日电 (记者郭扬)日前
2024-11-14 15:26:00
邮储银行承德市分行积极发展数字金融,与承德市工商联共同开展数字工商联活动,以金融之力,助推企业发展迈向新征程。针对中小微企业融资难
2024-11-14 15:30:00
为更好地服务广大客户,提升服务品质,富德生命人寿沧州中支在完善保险产品架构、提升常规保险服务品质的同时,持续加大增值服务项目的开发与落地
2024-11-14 15:31:00