• 我的订阅
  • 头条热搜
从架构、工艺到能效表现,全面了解LLM硬件加速,这篇综述就够了
...模型性能、能效表现来了一次全面概览。对人类语言进行大规模建模是一个复杂的过程,研究人员花了几十年的时间才开发出来。这项技术最早可追溯于 1950 年,当时克劳德・香农将信息理论应用于人类语言。从那时起,翻译和...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...层次,包括免费、开发者和企业级,满足从小规模开发到大规模企业部署的不同需求。用户可直接在官网上的交互界面进行体验,也可调用API。体验地址:https://inference.cerebras.ai/Cerebras Systems成立于2016年,团队由计算机架构师、...……更多
国产GPU万卡集群终于来了!摩尔线程CEO张建中:做难而正确的事
...,那么所需算力至少增长1000+倍,需要建立一个单节点超大规模算力集群来做训练。二是算法持续迭代,Transformer架构不能实现大一统,从稠密到稀疏模型,再到多模态模型的融合,多元架构持续演进并共存,面向特定领域设计...……更多
前谷歌科学家Yi Tay「LLM演义」系列博客第一弹:BERT为何匿迹江湖?
...回归模型。 2018年至2021年期间,出现了从单任务微调到大规模多任务模型的隐蔽的范式转变。所有人的注意力被慢慢吸引到统一的SFT模型上,这也是我们今天看到的统一的通用模型。用BERT来做到这一点实在是太难了。然而,BERT...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...方言语音合成。2.精细化 Token 对齐技术:我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构:我们设计了一种层次混合专家体系结构,用于学习多个汉语方言的统一表示和每种方言的特定表示...……更多
...助提示学习、强化学习、思维链等技术,大模型正朝着更大规模、更深层次、更多模态、更加对齐人类价值观的方向快速发展。采用大小模型协同和知识蒸馏等技术手段,可实现大模型的云、边、端部署,有效降低大模型落地对...……更多
生成式AI的抄袭输出问题值得关注(附图片)
...并不仅仅是简单地移除数据。由于AI大模型的训练依赖于大规模的数据集,删除部分数据集可能需要对模型进行重新训练,以确保模型的准确性和有效性,而这一过程需要消耗大量的时间和计算资源。此外,大模型在生成内容时...……更多
...AI回答接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,模型采用对话格式,可以根据考生和家长等用户输入的指令,通过自动化分析后生成专属同济大学的参考信息。同济大学本科生院院...……更多
“Sora目前仍不够可靠,应用场景受限”
...频假冒好友与陈先生聊天,从而实施诈骗。Sora如果实现大规模推广,将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍,Sora应用的技术与此前的深度伪造技术相互承接,又...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...(具体详见论文)。得出了以下几个有见地的发现:1. 更大规模的模型有更好的校准性能我们要求模型在回答问题时提供 0 到 100 的信心指数,以衡量模型的校准程度,即模型对其答案的自信程度。理想的校准模型应该是信心指...……更多
联汇科技荣获2024人工智能隐形冠军企业标杆Top10
...索、聚类和分析等服务。多模态预训练大模型(OmModel)基于大规模自监督学习的多模态人工智能算法,融合语言和视觉模态理解,实现下一代认知域人工智能应用场景落地。已完成基于行业的十亿级图文、亿级图片、万级视频大规...……更多
...股,每股回购价介于24.1843港元至24.4港元。AMD回应中国区大规模裁员传闻:失实,对组织架构小幅优化重组近期,有消息称超威半导体公司(AMD)即将在中国区进行大规模裁员,本轮裁员比例可能为10%-15%,或涉及数百名员工...……更多
微软与openai的合作源于对谷歌的担忧
...型至少六个月,并且有更多的时间来进一步开发和改进更大规模的模型。此外,斯科特还对谷歌的Gmail自动完成功能表示钦佩,称其“变得非常好”,并指出微软在机器学习规模方面已经落后于竞争对手多年。他认为,尽管微软...……更多
人均年薪100万,手机厂商数百亿开卷大模型
...厂商入场的心态绝不只是“重在参与”,而是真金白银地大规模投入。今年4月,小米组建大模型团队时,雷军就表明态度:“全力支持,投入不设上限。”目前,小米内部在做AI相关的研发人员超过3000人;向来低调的vivo创始人...……更多
...硕士学位,专注研究大语言模型在金融领域的应用,涉及大规模数据处理、自然语言处理、机器学习、深度学习和分布式计算。他曾在全球支付技术公司Visa任职数据科学家,主导开发了 “Visa账户攻击智能防御系统”,该系统采...……更多
联手火山引擎,华硕利用大模型和向量数据库推出AI功能笔记本
...多种火山引擎自研索引算法,通过沉淀字节跳动多业务线大规模、多场景实践经验,可广泛应用于智能问答、智能搜索、推荐系统和数据去重等多个不同领域,支持百亿级向量检索规模。 华硕官网的FAQ文档被高效地储存于火山...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...间或使处理器过热。据介绍,Gemini Ultra是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,该模型综合使用数学、物理、历史、法律、医学和伦理学等57个科目来测试世界知识和解决问题的能力,谷歌在一篇博客...……更多
oppocoloros15最新消息:支持ai大模型深度交互
...一加12和OPPOFindX7系列。这次的先锋内测名额十分有限,而大规模的公测和正式推送则预计要等到今年年底。值得一提的是,OPPO正在筹备OPPOFindX8系列,预计将于今年10月发布,首批搭载联发科天玑9400处理器。 ……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...能力,商汤能够有效支持万亿参数多模态模型的训练以及大规模AI推理。聚焦垂直领域的AI时代蓝图,旨在真正为客户创造价值商汤科技董事长兼CEO徐立在今年的WAIC上发言时指出,“要推动人工智能超级时刻的到来,大模型需要...……更多
李彦宏:过去18个月大模型领域最大变化是回答问题的准确性
...比去年更冷静,也更健康。”谈及生成式人工智能是否会大规模取代人类这个老问题,李彦宏谈道,回顾工业革命时期,也出现过类似情形,很多旧的工作岗位被替代,但创造出更多新的机会。“每次创新和技术革命发生时,被...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...方言识别准确率。方言底层逻辑+大模型今年5月,Meta推出大规模多语言语音 (MMS) 模型,将文本转语音和语音转文本技术从大约100种语言扩展到1100多种,还可以识别4000多种口头语言。在国内,抖音上线了地方方言自动翻译功...……更多
英伟达最新技术分享:手把手教你用Llama 3.1合成数据改进模型!附代码
...此外,也可以在LLM中设定特定角色,以针对特定任务进行大规模数据生成。使用合成数据评估RAG为了更好地理解上述讨论,我们来思考一个基本的流程,应用于一个具体的用例——为检索过程生成评估数据。下述流程的实现代码...……更多
百融云创荣获“2024大模型创新应用奖”
...复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模,并不等于更强模型能力。产业大模型考验的是算力+行业know-how+模型精调的综合能力。其中行业know-how尤为关键,这是专家经验、行业知识、组织能力、工程能力的...……更多
llava-1.6与gpt-4vmp面硬刚的性能,一起来看看
...来越卷,研发者们开始将关注点从性能转向成本,在关注大规模参数量的同时着力降低模型的运算和推理成本,实现模型压缩化和计算高效化。 ……更多
2023 CCF国际AIOps挑战赛决赛成功举办
...预训练语言模型》、《BigLog:面向统一日志表示的无监督大规模预训练方法》、《LogPrompt:面向零样本和可解释性日志分析的提示工程》等顶会论文分享。华为云核心网自动驾驶网络解决方案首席SE魏宏带来了《核心网运维大模...……更多
ai改变世界?英特尔轻薄本体验测试
...睿强劲的算力和不断的算法优化,英特尔是成功地把AIGC大规模地引入到了PC上,并且能够在终端侧离线运行,让PC用户们随时随地都能获得来自AIGC的创作主力,而不受网络、峰谷时期的限制,充分证实了他们在AIGC领域的领先地...……更多
大模型“翻车”小学题?
...个词的监督学习方式进行训练。简单来说,向大模型输入大规模的文本数据集,模型在训练学习后会根据当前输入的文本来预测下一个词的概率分布。通过不断比较模型预测和实际的下一个词,语言模型逐步掌握了语言规律,学...……更多
...品发布,OpenAI等企业的重大发布吸引全球目光;二是关注大规模产业应用和成本控制。成本是商业考量的第一要义,OpenAI目前已经4次降价,国内头部互联网企业的主力模型也不得不大幅降价或将全面免费。数字经济的发展经历...……更多
从0到1:国产化千卡集群的一小步,AI算力主动权的一大步
...以及KUAE ModelStudio模型服务,旨在以一体化交付方式解决大规模GPU算力的建设和运营管理难题。这是打造国产化智算集群的一小步,更是掌握AI算力主动权的一大步。 “如果买不到A100,我们到底该怎么办?”这是国内诸多用户在...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...智等,显著提升了业务效率。数字人技术在618期间支撑了大规模直播,展现了京东在数字人领域的商业化实力。何晓冬指出,当前大模型的核心人机交互介质有三种:在线下物理世界,通过场景理解、环境互动并执行复杂任务,...……更多
更多关于科技的资讯:
顶配2.9万!AMD锐龙9 9955HX3D游戏本可能要等4月初
快科技2月4日消息,AMD年初发布了面向高端游戏本的锐龙9000HX系列处理器,其中旗舰型号为锐龙9 9955X3D,第二次在移动端集成3D缓存
2025-02-04 21:41:00
ASML CEO:DeepSeek成功不代表芯片管制没效果
快科技2月4日消息,据媒体报道,ASML的CEO Christophe Fouquet近日表示,中国AI公司DeepSeek的成功显示了企业在面对AI市场时
2025-02-04 21:41:00
RTX 5090/5080还没买到 RTX 5070 Ti这就来了!大杀器
快科技2月4日消息,RTX 5090/D、RTX 5080虽然上市了,但能买到的人寥寥无几,而后续新卡正在接连不断地赶来
2025-02-04 22:41:00
年龄越大越健忘 其实这是大脑在不断进步
很多人认为,遗忘本身不是一件好事,我们应当尽可能将所有事情铭记于心。但实际上,“遗忘”是大脑具备的重要功能之一。可以说
2025-02-04 23:11:00
RTX 5090被黄牛炒至天价!网友想妙招对付抢购机器人
快科技2月4日消息,NVIDIA最新推出的RTX 5090和RTX 5080显卡在全球范围内都是一卡难求,由于供应有限
2025-02-04 23:11:00
微软推出新款Surface USB4扩展坞:轻至206克
快科技2月4日消息,据报道,微软近期发布了新款Surface USB4扩展坞,定价为199.99美元(大约相当于1450
2025-02-04 23:41:00
限时观测!就在明晚 月面X要现身了
2月5日,正月初八,天宇将迎来一轮上弦月。如果你抬头望向月亮,会发现月球表面浮现出类似字母“X”的光影,这也是今年第一场“月面X”
2025-02-04 23:41:00
任天堂谈Switch 2供应:我们正在为发售做充分准备
据外媒nintendoeverything报道,任天堂社长古川俊太郎在日前公布的财务报告里简要评论了Switch 2在今年晚些时候发售时的供应情况
2025-02-04 23:41:00
三星电子:Q1开始供应供应改良版HBM3E
快科技2月4日消息,据报道,预计从第二季度开始,三星电子改良版HBM3E的供应量将迎来全面增长,这一趋势与美国政府实施的尖端半导体出口管制政策紧密相关
2025-02-05 00:11:00
日本核电站中央控制室发生火灾:未对发射线管理区域外造成影响
快科技2月4日消息,据报道,当地时间2月4日,日本原子力发电公司发布紧急通报,指出当天下午,位于茨城县东海村的东海第二核电站中央控制室突发火灾
2025-02-05 00:11:00
能打过RTX 5070 Ti吗!AMD RX 9070系列2月底纸面发布
快科技2月5日消息,AMD原本计划在1月份就发布新一代RX 9070系列显卡,但因为性能、价格多方面的因素而被迫推迟,官方确认要到3月份才会上市(传闻到3月底)
2025-02-05 00:41:00
太疯狂了!高中生成功实现在PDF中运行Linux
快科技2月4日消息,在不久前,一位国外的高中生成功将1993年发布的射击名作《毁灭战士》移植到了PDF文件中,直接用浏览器打开文件就能玩
2025-02-05 00:41:00
一周打赏20万!各个品牌为做“榜一大哥”正在疯狂撒钱
顶流直播间刷礼物可以有多猛?5 分钟左右,接近 30 个嘉年华。按照一个嘉年华 3000 元一个计算,9 万,这满屏都是金钱燃烧的味儿 ↓ ↓如此高频的礼物刷屏
2025-02-05 00:41:00
为什么人类的耳朵不会动:2500万年前就消失了
很多动物都会竖起耳朵来倾听,这个时候它们通常看起来十分警惕,例如猫、狗和鹿都是如此。其实,如果您仔细观察的话,那么您会发现这些动物的耳朵不仅仅会竖起来
2025-02-05 00:41:00
我敢打赌 今年一定会有人买错电脑!万分谢谢Intel、AMD
虽说NVIDIA确实抢了不少风头,但隔壁 AMD 和 Intel 的新品,当然也都有关注。这篇文章就是来和大家聊聊,今年这两家的新处理器的
2025-02-05 01:11:00