【已修复】DeepSeek数据库暴露,泄露包括聊天记录在内的敏感信息
Wiz Research发现了一个属于DeepSeek的可公开访问的ClickHouse数据库,该数据库允许完全控制数据库操作,包括访问内部数据的权限。此次暴露包含超过百万条日志流,其中包含聊天记录、密钥、后端详细信息和其他高度敏感的信息。Wiz Research团队立即负责任地向DeepSeek披露了这个问题,DeepSeek随后迅速采取行动确保了数据安全
。
本文将详细介绍我们的发现,并探讨这一事件对整个行业的深远影响。
要点概述
DeepSeek是一家中国人工智能初创公司,近期因其突破性的AI模型,特别是DeepSeek-R1推理模型而备受媒体关注。该模型在性能上可与OpenAI的o1等顶级AI系统相媲美,并以其成本效益和效率著称。
在DeepSeek在AI领域声名鹊起之际,Wiz Research团队着手评估其外部安全状况,寻找潜在的漏洞。
很快,我们就发现了一个与DeepSeek关联的、可公开访问的ClickHouse数据库,完全开放且无需认证,暴露了敏感数据。该数据库托管在oauth2callback.deepseek.com:9000和dev.deepseek.com:9000。
这个数据库包含大量聊天记录、后端数据和敏感信息,包括日志流、API密钥和运营细节。
更为严重的是,这种暴露允许完全控制数据库,并可能在DeepSeek环境中进行权限提升,而且对外界没有任何认证或防御机制。
暴露详情分析
我们的侦查工作从评估DeepSeek的公开可访问域名开始。通过对外部攻击面的测绘(使用被动和主动的子域名发现技术),我们识别出约30个面向互联网的子域名。大多数看起来比较普通,托管着聊天机器人界面、状态页面和API文档等内容——这些最初都没有显示出高风险暴露的迹象。
然而,当我们将搜索范围扩展到标准HTTP端口(80/443)之外时,我们发现了与以下主机关联的两个异常开放端口(8123和9000):
-
http://oauth2callback.deepseek.com:8123 -
http://dev.deepseek.com:8123 -
http://oauth2callback.deepseek.com:9000 -
http://dev.deepseek.com:9000
进一步调查发现,这些端口连接着一个公开暴露的ClickHouse数据库,完全不需要任何认证就能访问——这立即引起了警报。
ClickHouse是一个开源的列式数据库管理系统,专为大型数据集的快速分析查询而设计。它由Yandex开发,广泛用于实时数据处理、日志存储和大数据分析,这表明这样的暴露是一个非常重要且敏感的发现。
通过利用ClickHouse的HTTP接口,我们访问了/play路径,这允许通过浏览器直接执行任意SQL查询。运行简单的SHOW TABLES;查询就返回了完整的可访问数据集列表。
在这些表中,log_stream表特别引人注意,它包含了大量带有高度敏感数据的日志。
log_stream表包含超过100万条日志条目,具有以下特别敏感的列:
-
timestamp – 从2025年1月6日开始的日志 -
span_name – 涉及各种内部DeepSeek API端点 -
string.values – 明文日志,包括聊天记录、API密钥、后端详细信息和运营元数据 -
_service – 指示生成日志的DeepSeek服务 -
_source – 暴露日志请求的来源,包含聊天记录、API密钥、目录结构和聊天机器人元数据日志
这种级别的访问权限对DeepSeek自身的安全性和其最终用户都构成了严重风险。攻击者不仅可以获取敏感日志和实际的明文聊天消息,还可能根据其ClickHouse配置,使用类似SELECT * FROM file(‘filename’)这样的查询来窃取明文密码和本地文件以及专有信息。
(注:为了保持道德研究实践,我们没有执行超出枚举范围的侵入性查询。)
关键启示
在缺乏相应安全措施的情况下快速采用AI服务本身就存在风险。这次暴露突显了一个事实:AI应用程序的即时安全风险主要来自支持它们的基础设施和工具。
虽然围绕AI安全的关注多集中在未来的威胁上,但真正的危险往往来自于基本风险——比如数据库的意外外部暴露。这些对安全性至关重要的基本风险应该始终是安全团队的首要任务。
随着组织争相从越来越多的初创公司和供应商那里采用AI工具和服务,必须记住,这样做就是在将敏感数据托付给这些公司。快速采用往往会导致忽视安全性,但保护客户数据必须始终是首要任务。安全团队必须与AI工程师密切合作,确保对所使用的架构、工具和模型有充分的了解,这样我们才能保护数据并防止暴露。
结论
世界从未见过一项技术能以AI这样的速度被采用。许多AI公司已经迅速成长为关键基础设施提供商,却没有通常伴随这种广泛采用的安全框架。随着AI深度融入全球企业,业界必须认识到处理敏感数据的风险,并实施与公共云提供商和主要基础设施提供商要求相当的安全实践。
本文来源于独眼情报,原文地址:https://www.wiz.io/blog/wiz-research-uncovers-exposed-deepseek-database-leak