• 我的订阅
  • 头条热搜
借助大模型能力,晓多科技智能客服的效率与服务双提升
...客服在岗前、岗中均有性能提升的需求。利用大模型的强上下文理解能力、总结能力和自然语言多轮对话的特性,帮助客服完成从浏览推荐到下单付款的购物全生命周期旅程。为此,晓多科技不仅自研“晓模型 XPT”,还携手火...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车辆能够像经验丰富的人类驾驶员一样,具备有效定位和预测潜在风险因素的...……更多
微软宣布Team Copilot发布,年内将推出初步预览版
...此类新功能构建的Copilot现在可以利用内存和知识来获取上下文信息、推理操作和输入、根据用户反馈进行学习并在遇到不知道如何处理的情况时寻求帮助,从而独立管理复杂、长期运行的业务流程。AzureAIStudio现已支持提供GPT-4oA...……更多
腾讯元宝 AI 搜索解析能力升级,支持千万字超长文处理
...网址,以及 PDF、word、txt 等多种格式的文档;支持超长的上下文窗口。 ……更多
...继续提出“把万里长城变成雪景”指令时,华藏可以根据上下文语境,对图片进行相应指令的修改——万里长城瞬间平添皑皑雪景。这种“文修图”能力是华藏自研技术之一,使用了数百亿的数据进行模型训练而成。包括文修图...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...切,解决LLM推理的所有缺陷。比如,模型很容易被无关的上下文干扰,这一点和人类思维也很类似。实验中发现,在GSM8K数据集中添加无关上下文,可以导致模型性能出现高达20+百分点的损失。此外,LLM的自我纠正能力也并不健...……更多
ChatGPT和文心一言强化了搜索能力,大模型下一站比拼什么:算法推送?
...键入精准关键词,ChatGPT搜索其独特优势在于能理解对话上下文,提供连贯且针对性的答案,并依据用户提问历史和偏好,定制个性化搜索结果。 很显然,大模型引入搜索功能不是GPT一家的独创,在咱们国内也有头部企业开始了...……更多
CPU,正在被AI时代抛弃?
...性,高效快速地完成矩阵/向量计算;优化实现针对超长上下文和输出的FlashAttention/FlashDecoding等核心算子,降低数据类型转换和数据重排布等开销;统一内存分配管理,降低推理任务的内存占用。 ●算法层面:在精度满足任务...……更多
...效捕捉局部信息和短依赖信息,使模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式本质,大幅提升数理逻辑、数学计算、代码生成能力。浪潮信息于2021年9月在业界率先推出了中文人工智能(AI)巨量模...……更多
openai推出assistantsapi:专门构建ai工具
...ing),允许开发人员将线程状态管理移交给OpenAI,并解决上下文窗口长度约束的问题。OpenAI开发者体验主管Romain现场演示了AssistantsAPI,他声称开发者只需输入聊天助手的名称、简介,并选择需要使用的模型,接着选定需要的工...……更多
科大讯飞星火大模型亮相北京车展
...项全栈自研的技术,它深度融合了大模型的概括、推理、上下文理解和复杂内容生成等能力,与行车、通信、娱乐等多种用车场景紧密集成,结合语音和视觉交互,可以用户带来更自然、自由、智能的座舱体验。凭借其创新设计...……更多
新华全媒+|仿生机器人、无人飞行器、智能公交车……智博会上看“智造”
...了长图文识别功能,能够直接对复杂版面进行分析、结合上下文语义进行更加精准的文字识别;升级后的“星火语音大模型”还具备情感模拟与表达能力,“一句话声音复刻”功能也使AI语音表现更加生动真实。高端化、智能化...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...交类型数据的积累。Soul X具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。基于该自研模型,平台先后推出了拟人型智能对话机器人“AI苟蛋”、AI聊天助理等创新场景和功能,...……更多
当生成式人工智能走向战场
...话场景生成特定的文本、图片、音频等信息,还可以根据上下文自动生成与人类语言类似的对话,与用户进行密切交流。可以说,生成式AI是集大数据、大模型、大算力为一体的产物。也可以说,正是因为当前社会信息数据爆炸...……更多
mistralai公司推出mixtral8x22b开源模型
...出了Mixtral8x22B开源模型,共有1760亿个参数,Context长度(上下文文本)为6.5万个token,可以通过Torrent下载。MistralAI公司自成立以来一直备受外界关注,“6人团队,7页PPT,8亿融资”不断缔造传奇,而且在得到微软的投资之后更是...……更多
智谱AI再卷价格战:最低1毛线可买近200万tokens,相当于两本《红楼梦》文字量
...列开源模型GLM-4-9B问世,具备更强大的推理性能、更长的上下文处理能力、及更强大的多模态能力。同时,其通用能力提升达40%,超越Llama 3。Function Call函数调用能力提升40%,比肩GPT-4。智谱AI CEO张鹏表示,“2024是AGI元年,大模...……更多
2023金融大模型报告|智能交易:求解知易行难
...,例如通过应用大模型的关键信息提取、智能文本生成、上下文联想、多轮对话等核心能力和特点,重塑金融市场核心交易业务流程。在交易研判阶段,使用大模型技术,提升投融资方案计划的制定能力;在交易执行阶段,通过...……更多
...致训练成本飙升。“简单来说,就像做阅读理解时忽视了上下文的语义关系,导致生成图像中经常出现偏差需要反复修正,大幅增加了训练成本。”程明明说。如何降低训练成本、提高训练效率?研究团队在扩散训练过程中引入...……更多
大模型注智 “中国电信AI客户助理”引领智能服务新篇章
...练,AI客户助理能够精准理解电信领域名词和手机品牌的上下文关联,提升用户交互体验和服务质量。同时,支持中文普通话、四川方言、粤语、英语等各种方言语种。此外,中国电信在自然语言处理与交互逻辑、意图识别技术...……更多
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...f-Correction作者团队将自我纠错的过程抽象为对齐任务,从上下文学习(In-context learning)的角度对自我纠错进行了理论分析。值得一提的是,他们并没有使用线性注意力机制下的线性回归任务进行理论分析,而是使用真实世界LLM...……更多
Jina AI 推出全球首个开源 8K 文本嵌入模型
...na-embeddings-v2模型,号称是目前是唯一支持8K(8192个token)上下文长度的开源产品,在功能和性能上与OpenAI的text-embedding-ada-002类似。在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现,官方进行如下解释:与OpenAI的8K模型tex……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...测基准上的领先表现;代码和数学能力显著提升;增大了上下文长度支持,最高达到 128K tokens(Qwen2-72B-Instruct)。模型基础信息Qwen2 系列包含 5 个尺寸的预训练和指令微调模型,其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-5……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...antization) 最大序列长度为8,192个数据单元,以处理更长的上下文信息纽约时报点评道,开源Gork背后的原始代码,是这个世界上最富有的人控制AI未来战斗的升级。Meta CEO扎克伯格刚刚也对Grok做出了评价:“并没有给人留下真正深...……更多
AI大厂硬刚价格战,中小模型夹缝求生存
...长文本切入,20万字是当时所有大模型里所能支持的最长上下文输入长度,简而言之,Kimi甚至可以帮你轻松阅读《三体》,同时也大大提升了内容创作和整理的效率。而紧接着在3月升级至200万字后,Kimi一度火到宕机。通过实现...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
字节开源全栈AI编程基准,不小心曝光豆包代码大模型
...两种策略。在Reflection策略中,通过利用SandboxFusion的反馈上下文对答案进行N次精炼,复现了自我精炼策略 [Madaan et al., 2024]。而在BoN策略中,仅进行N次推断以获得结果。结果如图所示,“Reflection”策略明显优于“BoN”,这表明San...……更多
生成式AI:手机厂商高端梦最后的希望
...集的云端进行。同时,由于本地设备可以访问用户的实时上下文信息(如位置、当前活动等),所以AI的响应能够更加准确和个性化,比在云端运行AI应用更为高效。”实际上,端侧AI如何解决算力和内存等限制,也是很多厂商在...……更多
Motiff妙多发布国内首个UI大模型,效果跑分超越苹果、GPT-4o
...reenAI等现有解决方案相比,Motiff妙多大模型能灵活地根据上下文理解界面元素,达到“设计专家”水平,最接近人类对UI界面的理解和表述结果。 权威UI指标横评中,Motiff妙多大模型所有指标均超过GPT-4o和Ferret UI最懂UI的大模型...……更多
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
...Flash内核进行比较,微基准测试结果显示,Flex有望被用于上下文更长、解码规模更大的问题场景。英伟达H100 SXM5 80GB上的FlexAttention内核基准测试未来展望接下来,我们期望进一步优化矩阵乘法(matmuls),以更充分地利用硬件。...……更多
所谓AI革命,到现在为止,是能源的一场“灾难”
...意力机制处理数据,并考虑序列的不同部分或句子的整个上下文,从而生成对模型结果的预测。市面上先进的LLM通常包含了万亿级别的参数,参数越多,模型复杂度越高,训练时的计算量就越大。 模型训练的基础数据(如大规...……更多
更多关于科技的资讯:
美国科技巨头“收割者”!国产DeepSeek干掉英伟达4.3万亿市值
快科技1月28日消息,临近春节,中国人工智能公司DeepSeek突然爆火,其发布的DeepSeek-R1大模型性能上比肩OpenAI o1
2025-01-28 09:06:00
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
快科技1月28日消息,日前,美股收盘英伟达股价暴跌17%,市值一夜蒸发5888.62亿美元(约合人民币4.27万亿元)
2025-01-28 10:07:00
王晶监制电影《笑傲江湖》上线爱优腾:张雨绮版东方不败来了
快科技1月28日消息,今日,电影《笑傲江湖》在腾讯视频、爱奇艺、优酷三大平台上线,同时发布“春满江湖”版海报。海报中,东方不败(张雨绮饰)侧卧雪地
2025-01-28 10:07:00
7月11日上映!DC《超人》新预告发布:只身大战反派、怪兽
快科技1月28日消息,DC全新的《超人》发布了新版预告,展示了超人翱翔于冰原之上、只身大战怪兽的场景,卢瑟等反派人物也一一登场
2025-01-28 10:37:00
快来看哪个更牛!网友热捧DeepSeek创意写春联
快科技1月28日消息,据媒体综合报道,近日,随着新春佳节的临近,一股创意写春联的热潮正在网络上悄然兴起。而在这场创意盛宴中
2025-01-28 10:37:00
李子柒将首次亮相央视《春晚》:讲述服饰的非遗故事
快科技1月28日消息,据央视频官方透露,今晚李子柒将首次亮相央视《春晚》,并担任“春晚体验官”,讲述演出服饰上的非遗故事
2025-01-28 11:07:00
育碧再次大裁员!185名员工被裁 英国工作室永久关闭
据eurogamer报道,育碧近日宣布,将关闭位于英国莱明顿的工作室,并裁减公司185个职位。部分莱明顿工作的员工将通过远程合同继续留职
2025-01-28 11:07:00
全球罕见!中国这两座城市又有“雪窝子”了
快科技1月28日消息,据媒体报道,近日,山东半岛东北部的烟台和威海再次因其频繁的降雪而备受关注,被形象地称为“雪窝子”
2025-01-28 11:07:00
直角拐弯学废了:妈妈练完车回家过桥把女儿撞进水沟
快科技1月28日消息,今天,话题#妈妈练完车回家过桥把女儿撞进水沟#登上热搜。据报道,事发1月26日,一位年轻妈妈在练完车后驾车回家
2025-01-28 11:37:00
DeepSeek爆火 网友热议广东AI三杰
快科技1月28日消息,据媒体综合报道,近日,随着DeepSeek公司的崛起,其创始人梁文锋成为了公众瞩目的焦点。这位1985年出生于广东湛江的科技奇才
2025-01-28 11:37:00
斥资5个亿!迅雷将收购虎扑
快科技1月28日消息,据新浪科技报道,迅雷(XNET.US)已同意以5亿元人民币的总现金对价收购运营体育平台虎扑的上海匡慧网络科技有限公司
2025-01-28 12:07:00
最烧钱的国产单机!《影之刃:零》成本将达4亿 超《黑神话:悟空》
快科技1月28日消息,据媒体报道,国产动作游戏领域再添重磅消息。由北京灵游坊开发并发行的黑暗风格武侠动作游戏《影之刃:零》
2025-01-28 12:37:00
余承东自驾回老家被抢道 享界S9迅速反应减速避让
快科技1月28日消息,昨天上午,余承东开启了自己“自驾回安徽老家过年”的直播活动,其实是提前的录播,即便如此,其抖音直播间也被封禁
2025-01-28 13:37:00
DeepSeek用莫言风格写《蔚来换电记》 还真是那个味儿
快科技1月28日消息,近日,DeepSeek在全网范围内引发了热烈的关注与讨论,其火爆程度堪称现象级。就连蔚来汽车的创始人李斌也对其进行了亲自体验
2025-01-28 14:37:00
阿里云通义开源Qwen2.5-VL:最强视觉AI 超越GPT-4o
快科技1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中
2025-01-28 15:07:00