• 我的订阅
  • 头条热搜
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...推出的两款轻量级大模型ERNIE Speed、ERNIE Lite,支持8K、128k上下文长度。竞争对手纷纷降价,腾讯不免也会被拉来比较。对此,吴运声对时代财经等媒体回应指出,腾讯大模型的底层能力和构建工具链仍在快速迭代过程中。未来腾...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
...一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理,上下文窗口128k,支持数十种自然语言以及80+编程语言。特别在MMLU上,其预训练版本更是达到了84.0%的准确率。消息一出,Mistral AI联创兼首席科学家第一时间转发,直接cue ...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...发者提供了前段时间在I/O大会上官宣的Gemini 1.5 Pro的200万上下文窗口访问权限、Gemini API的代码执行功能,并在Google AI Studio中添加了Gemma 2。在最新的博客中,谷歌宣布向所有开发者开放了Gemini 1.5 Pro的200万token上下文窗口访……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...到与用户意图最相关的知识,然后将足够多的知识加载到上下文窗口,借助长窗口模型对搜索结果做进一步的总结和提炼,更充分地发挥上下文窗口能力,帮助模型生成最优结果,从而实现各技术模块之间的联动,形成一个闭环...……更多
kimi开放平台contextcaching功能将启动内测
...aching功能将启动内测,届时将支持长文本大模型,可实现上下文缓存功能。▲图源Kimi开放平台官方公众号,下同据介绍,ContextCaching(上下文缓存)是由Kimi开放平台提供的一项高级功能,可通过缓存重复的Tokens内容,降低用户...……更多
蔡崇信:中国八成科技企业和一半大模型公司都跑在阿里云上
...ainer Compute Service),以及一站式模型应用开发平台阿里云百炼。周靖人在大会上透露,阿里云AI开源社区魔搭社区已经拥有了超过280万的AI活跃开发者,拥有包括百川、GLM、通义千问、书生在内的一系列知名基础模型,社区内模...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...,Meta还推出了1B和3B两个轻量级纯文本的版本,可支持128K上下文。别看参数少,1B/3B在总结摘要、指令遵循、重写等任务上,表现非常出色,而且专为Arm处理器做了优化。LeCun激动地表示,「可爱的大羊驼宝宝来了」!Meta首席技...……更多
meta发布llama3.3:支持8种语言
...,让其与人类对有用性和安全性的偏好保持一致。Llama3.3上下文长度为128K,支持多种工具使用格式,可与外部工具和服务集成,扩展模型的功能。安全方面,Meta采用数据过滤、模型微调和系统级安全防护等措施,以降低模型滥...……更多
国行iPhone无缘苹果AI首测 客服回应:以正式上线版本为准
...iri的对话能力会变得更自然,更符合语境,并且可以联系上下文进行对话。不过,苹果AI想引入中国市场存在一些难题,根据政策要求,苹果需要与本土供应商合作。有消息称,苹果与百度和阿里巴巴等生成式大模型进行过接洽...……更多
Soul App出席联发科技天玑开发者大会,加速布局安全、个性化AIGC新生态
...交类型数据的积累。Soul X具备prompt驱动、条件可控生成、上下文理解、多模态理解等能力,能够实现有情感、有温度的交互。基于该自研模型,平台先后推出了拟人型智能对话机器人“AI苟蛋”、AI聊天助理等创新场景和功能,...……更多
零样本即可时空预测!港大、华南理工等发布时空大模型UrbanGPT | KDD 2024
...即整合时空依赖编码器,以提升大型语言模型在捕捉时空上下文中的时间序列依赖性的能力。具体来说,我们设计的时空编码器由两个核心组件构成:一个是门控扩散卷积层,另一个是多层次关联注入层。上式 为初始化时空嵌...……更多
Anthropic开源MCP:大模型接入数据有了“统一插头”,Agent平台慌了?
...Slack、GitHub等平台的数据了。近日,Anthropic开源了“模型上下文协议”(MCP),该协议将大模型直接连接至数据源,简单来说,现在企业和开发者要把不同的数据接入AI 系统,都得单独开发对接方案,而MCP要做的,就是提供一个...……更多
协同办公进入AI时代 金山办公张宁:不追求最强AI大模型,合适最重要
...技术之前,WPS只能针对单个单词进行拼写检查,无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic Claude 3系列模型进行语义检查与文档润色。Claude基础模型拥有平均1.3秒到1.5秒的快速响应能力,可有效提升...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...议,在使用语言模型输出时应格外小心,特别是在高风险上下文中,使用符合特定用例需求的确切协议(如人工审查、附加上下文的基础或完全避免高风险使用)。不过,GPT-4相对于以前的模型显著减少了幻觉。在OpenAI的内部对...……更多
...项目总成本为2.7亿元。Kimi智能助手宣布支持 200 万字无损上下文36氪获悉,通用人工智能创业公司“月之暗面”(Moonshot AI)宣布在大模型长上下文窗口技术上取得新的突破,Kimi智能助手已支持200万字超长无损上下文,并于即日...……更多
从云栖大会,看阿里的科技本色
...重磅发布,发布了一站式大模型应用开发平台——阿里云百炼。阿里云百炼集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,让企业用户能够简单地部署底层算力,...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...LM 中,显式记忆是继隐式记忆(模型参数)和工作记忆(上下文键值)之后的第三种记忆形式。 具体而言,本文引入了一种新的记忆格式,即显式记忆,其特点是写入成本和读取成本相对较低。如图 1 所示,模型首先将知识库...……更多
通义千问主力模型大幅降价85%!阿里云CTO:降价空间仍很大
...继续免费为用户提供服务,同时,用户也可以通过阿里云百炼平台调用Qwen-Max的API。【本文结束】如需转载请务必注明出处:快科技责任编辑:黑白文章内容举报 ……更多
Chat AI项目丨对标DeepMind Gato,人工智能模型「DB1」已在多领域落地验证
...eepMind在2022年5月推出的“通才”型人工智能模型,会根据上下文决定是否输出文本、关节扭力、按钮按压或其他标记物,具有多模态、多任务和多组件的特点。官方信息显示,Gato可以执行604项不同的、多领域一般任务,这些任...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...驱动的LLM文本生成」。RAG于2020年推出,它使用动态提示上下文,通过用户问题检索并注入LLM提示,以引导其使用检索到的内容,而不是预训练的知识。Chat LangChain是由RAG支持的、在Lang Chain文档上流行的Q/A聊天机器人。上下文学...……更多
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...t (ICLR 2024) 适应到目标数字人的高效微调策略和(2)具有上下文学习能力的人脸动作生成模型,MimicTalk 可以生成相比原有方法更高质量、更具表现力的数字人视频。此外,单个数字人模型的训练时间可以被压缩到 15 分钟以内,...……更多
Kimi开启大模型应用元年 券商推荐万兴科技掌阅科技等龙头
...助手近期实现的现象级突破。此前,月之暗面将Kimi的无损上下文长度输入能力从此前的20万字提升到了200万字,应用场景扩展到更大范围。随着Kimi的爆红,多家相关上市公司被广泛关注,并积极回复外界关切。AIGC软件A股上市公司万...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...asoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性。实验结果表明,TS-...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索能力,又可以评估其对文本长程依赖的建模和理解能力。结果不评不知道,一评估发现这些模型在复杂的长...……更多
gpt-4.5turbo官方发布会或将本周四
...那么GPT-4.5Turbo被“剧透”的信息有哪些呢?首先是更大的上下文窗口,预告信息显示,GPT-4.5Turbo的上下文窗口是GPT-4Turbo的两倍,达到了256K,相当于约200000个单词。预告还透露,GPT-4.5Turbo的“知识更新截止日期”是2024年6月,意...……更多
阿里云CTO周靖人:全面投入升级AI大基建
...最高降幅85%,百万tokens价格低至0.3元。过去半年,阿里云百炼平台持续降低大模型调用的门槛,进一步推动大模型的普惠。据悉,中国一汽、联想、微博、携程、喜马拉雅、三得利(中国)等30多万企业客户已经接入通义大模型...……更多
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
...「grok-beta」,该模型目前正处于开发的最后阶段。该模型上下文长度为128000 token,这意味着Grok可以处理更长的文本输入,理解更复杂的上下文关系。此外,该模型不仅支持函数调用,也能支持系统提示词。从而让开发者能够更...……更多
...现场,周靖人发布一站式大模型应用开发平台——阿里云百炼,该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、...……更多
对标or颠覆?Anthropic让创业者狠狠共情
...能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常...……更多
AGI一日要闻:台积电预测2040年GPU芯片性能提升1000倍;Scale估值高达130亿美金
...k。如今,马斯克更新到Grok 1.5模型。新一代模型实现了长上下文理解和高级推理能力,计划将在未来几天内向早期测试人员和 X 平台(前 Twitter)上的现有 Grok 用户提供。具体来说,首先,Grok-1.5 最明显的改进之一是其在代码和...……更多
更多关于科技的资讯:
MWC现场直击:手机、运营商齐卷AI,硬件也要新故事
文 | 王方玉编辑 | 苏建勋万众期盼中,MWC 2025(世界移动通信大会)于3月3日在西班牙巴塞罗那正式拉开帷幕。作为全球通信行业的顶级盛会
2025-03-07 01:04:00
《哪吒2》票房破146亿!冲击全球第6 距《复联3》一步之遥
快科技3月6日消息,今日,据网络平台数据显示,动画电影《哪吒之魔童闹海》(以下简称《哪吒2》)总票房(包含港澳台及海外票房)突破146亿元
2025-03-06 19:43:00
智界R7车主称开智驾出严重事故:事发原因公布看呆网友
快科技3月6日消息,近日有小红书用户,同时也是智界R7车主发帖称,自己新提的车才1个月,结果在高速路上出事故导致车辆被撞报废
2025-03-06 19:43:00
顺鑫农业牛栏山持续引领行业品牌创新,让中国白酒融入烟火气
2024年度,中国白酒行业风云变幻、竞争激烈,而顺鑫农业旗下的牛栏山酒厂在这一年中的表现则可圈可点。牛栏山酒厂在其2024年度厂务公开暨总结表彰大会上
2025-03-06 20:13:00
雷军:小米汽车已交付超18万辆 还有15万台在排队
快科技3月6日消息,据报道,全国人大代表、小米集团董事长雷军在大会上表示:去年我在全国人代会上表态,一定会把小米汽车干好
2025-03-06 20:13:00
12万的“青春版奥迪” 奇瑞艾瑞泽8 PRO值得买吗
在12万级家用轿车市场,消费者常常面临“选国产还是合资”“要配置还是品牌”的纠结。如今,随着奇瑞艾瑞泽8 PRO的预售开启(起售价11
2025-03-06 20:13:00
五菱汽车发布正面盈利预告:净利润1.04亿同比增长约50%
快科技3月6日消息,五菱汽车在港交所发布正面盈利预告,预计截至2024年12月31日止年度将录得净利润约1.04亿元人民币
2025-03-06 20:13:00
刷新岛城春天的N种打开方式!上抖音,焕新青岛春日生活
摘要:相约青岛“过春天”,上抖音,焕新春日生活!春回大地,万象更新。褪去厚重的衣物,换上轻盈的春装,和三五好友围坐小马扎
2025-03-06 20:25:00
东科克诺尔:做好节能降耗 “加减法” 打造绿色工厂
十堰广电讯(全媒体记者 吕行 李昀翔)企业践行绿色发展,节能降耗是关键。东科克诺尔商用车制动有限公司通过调整生产工艺、科技化手段利用等方式
2025-03-06 20:28:00
护眼台灯哪个牌子好?掌握这三个挑选诀窍,远离智商税!
每当孩子写作业、看书的时候,我们总会担忧不良光线伤害孩子的眼睛。可想要挑个合适的护眼台灯,简直比解数学难题还让人头疼!市面上五花八门的牌子
2025-03-06 20:30:00
3月6日阳曲县消息,健康阳曲平台通过接入DeepSeek大语言模型,全面升级县域慢病AI辅诊能力,阳曲县在智慧医疗领域迈入全新阶段
2025-03-06 20:32:00
Manus创始人是中国90后:毕业于华中科技大学
快科技3月6日消息,继DeepSeek之后,科技圈又迎来一款全新的通用型AI Agent产品Manus,它由中国团队打造
2025-03-06 20:43:00
“英伟达小弟”上市风波不断:创始人巨额套现遭质疑 大客户被传撤单
随着本周被称为“英伟达小弟”的美国云计算平台CoreWeave递交上市招股书,这份充满“金融交易智慧”的文件令吃瓜群众大开眼界
2025-03-06 21:13:00
聚焦9大领域打造60+应用新场景 重庆发布人工智能赋能超大城市现代化治理三年行动计划
3月6日,上游新闻记者从重庆市城市治理委员会办公室获悉,为深入推进国家“人工智能+”战略部署,创新探索人工智能赋能超大城市现代化治理新路径
2025-03-06 21:14:00
车位到车位全程自主通行!广汽NDA4.0高阶智驾官宣:首搭昊铂HL
快科技3月6日消息,广汽昊铂宣布其NDA 4.0城市领航高阶智驾系统将率先应用于中大型SUV昊铂HL,该车型将于3月18日启动预售
2025-03-06 21:43:00