https://academic.oup.com/cybersecurity/article/12/1/tyag005/8465357
Last edited by @suen 2026-02-09T00:18:03Z
https://academic.oup.com/cybersecurity/article/12/1/tyag005/8465357
Last edited by @suen 2026-02-09T00:18:03Z
下面是对这篇论文的“详细整合版”解读(把它的研究问题、方法、核心发现、技术机制与治理逻辑串成一条线)。
作者关注的是一个近年越来越明显、但又常被误读的现象:中国的政府网站对“境外访问”变得越来越不可达,其中一部分是明确的地理封锁(geo-blocking),另一大部分则更像是跨境链路/基础设施瓶颈导致的普遍超时。作者把这组现象概念化为“Reverse Great Firewall(反向长城防火墙)”:不是把国内用户挡在“墙外”,而是把国外用户挡在“中国网内的某些信息资源之外”。 
文章强调两点:
• 这不是一个“全国统一、同一种技术、同一条命令下发”的单体系统,而是碎片化的、多层技术与多级政府组织逻辑交织的结果。 
• 它与中国语境下“网络安全/数据安全”的外延有关:不仅是防黑客,也包括对“信息聚合、开源情报(OSINT)、数据挖掘”这类“被外部看见/被外部整合”的风险焦虑。 
⸻
数据源:中国官方的“全国政府网站基本信息数据库”,覆盖“现存的全部政府网站”,作者拿到 13,508 个链接(官方标记其中 13,497 应正常运行)。并声明全量数据集在 Zenodo 上可得。 
测量设计:
• 使用 HTTP/1.1 请求;
• 通过 14个国家/地区的住宅代理(residential proxies) 从境外发起访问;
• 以中国境内(上海)作为对照;
• 将返回结果归类为:可访问、显式封锁(如 403/特定提示)、DNS 解析异常、超时、其他错误等。 
这套设计的关键价值在于:它不是抽样少数网站,而是对“官方登记的全部政府网站”做系统测量,因此能把**结构性分布(哪些层级/哪些省市/哪些技术手段)**描出来。 
⸻
作者给出一个很清晰的总体结论:
• 从境外看,超过 50% 的中国政府网站不可访问;
• 其中大约 ~10% 表现出明确且“对多数国家一视同仁”的地理封锁(主要是 server-side 或 DNS 层);
• 剩下约 ~40% 更像是网络瓶颈/基础设施碎片化导致的跨境不可达,而不是“协调一致的政策封锁”。 
在“反向长城防火墙”的讨论部分,作者又把它压缩成一个四层“访问限制分类法”(Table 5),非常好用:
1. DNS-Based Blocking(DNS 层):2–3%
2. CDN/WAF Geo-Filtering(CDN/防火墙层):<1%
3. Cross-Border Time-Outs(跨境路由/传输层超时):38–40%
4. Server-Side Geo-Blocking(应用/服务器层 403 等):5–7% 
作者还提醒:显式封锁比例可能被“超时”掩盖(请求都进不去,自然看不到 403),因此推算地理封锁的真实上限可能到 ~10.5%(以对美代理的 server-side blocking 比例外推)。 
⸻
A. DNS 层:域名只对“国内 DNS”好使
表现为:用境外解析器解析失败,但换成中国境内 DNS 可能正常。作者将其视为“中等可见度”的限制:你能观测到解析失败,但不容易断言动机(配置、运维、或有意为之)。 
B. CDN/WAF 层:解析成功了,但被边缘节点/规则拦住
作者指出一种更“黑盒”的情况:CDN 把境外流量导向特定节点,然后在那里拒绝服务或触发 WAF,从而造成“看起来像故障”的效果(不透明度高)。 
C. 跨境超时:最大宗的“不可达”,但未必是“封锁”
这是占比最大的类别(约 38–40%),作者倾向把它解释为:跨境链路瓶颈、深层路由质量差、基础设施碎片化等;同时也谨慎提到:有研究猜测 GFW 的数据检查可能影响跨境流量,但由于跨境网络是黑盒,很难在无内部信息情况下定论。 
D. 服务器侧显式封锁:最“可归因”的地理封锁
这是“可见度最低(最不隐蔽)”的一类:应用层直接拒绝(如 403 或定制错误页)。作者给了一个非常典型的例子:浙江某地网站对境外请求(除香港)返回非标准 420,并把 IP 送到“疑似攻击被拉黑”的页面;但即便是研究团队从未使用过的真实住宅网络 IP,也被一刀切拒绝,显示其“宁可错杀”的防御取向。 
⸻
作者最有解释力的一点,是把技术分布和中国政府网站的管理结构对齐:
• 没有公开政策文件明确“要搞 geo-blocking”,因此更像是地方在中央“网络安全/数据聚合风险”压力下的地方化解读与应对。 
• 省/地市层级更关键:数据上,显式 geo-blocking 在省域里主要集中在安徽、河南,并在其下属多个地市扩散;但并非所有下级都同步,显示存在资源/意见/节奏差异。 
• 这种“成片出现”与基础设施托管关系有关:按国务院关于政府网站的管理框架,部委与省政府办公厅对辖区网站基础设施负责;地市可申请独立基础设施,县级多依赖上级,因此会出现“同一托管体系里一起封/一起不封”的批次特征。 
另外还有两个非常耐人寻味的观察:
例外:对港澳台的封锁更“克制”
总体上显式封锁对各国差别不大,但香港与台湾的封锁比例更低(约 3.7%/3.6%,且只有约三分之二的“对全球封锁者”会对港/台同样封锁)。作者认为这既进一步体现碎片化,也可能反映“风险评估不一致”或与“政治动机(统一叙事)”存在张力。 
“制度学习”正在发生:先试水、再固化、也可能回滚
作者给出一些时间线证据:安徽与最高法(SPC)都经历过间歇性封锁后转为持续稳定;全国人大在 2024-05-21 至 2024-05-23 曾短暂对“大陆+港澳台以外”全封后又放开;江西 2025 年初曾省级统一封锁后又回滚,但部分地市仍持续封锁——整体像“试水—评估—扩张/回撤”的学习过程。 
⸻
这篇文章的贡献不只是“发现很多网站境外打不开”,而是给了一个可操作的解释框架:
• 把“不可达”拆成四层机制(DNS / CDN-WAF / 跨境超时 / 服务器拒绝),避免把所有现象都粗暴归因成“政策封锁”。 
• 把技术分布与组织结构绑定:为什么是某些省/地市成片出现,而不是全国一刀切。 
• 把动机放回中国语境的“网络安全”外延:包含对 OSINT/数据聚合风险的治理焦虑,同时又受“政府信息需面向国内公众可得”的约束,使得 geo-blocking 成为一种“相对不影响国内可达性”的工具选项。 
对现实影响层面,作者点明:这会让研究者、企业、海外华人/涉华利益相关者更难获取政府信息,而且由于对“未授权代理/VPN”整治,绕过并不总是容易。 
⸻
作者明确承认:
• 缺少长期纵向数据,难以稳健刻画“它是如何随时间扩张/收缩的”;
• 在缺乏公开政策讨论的情况下,对动机与未来走向必须谨慎;
• 对跨境超时的成因更难定性。 
同时他也提到一个可能的改善变量:2024年7月宣布新增6个国际互联网出入口(广西、山东、云南、海南),若建成且容量足够,可能缓解部分“超时型不可达”。 
⸻
如果你想把这篇论文用在你自己的研究/测量/写作里,我可以再给你两样“可直接落地”的东西:
1. 把 Table 5 的四层分类法改写成一套可复现实测的诊断流程(每一层用哪些探针/日志特征区分)。
2. 按作者的思路,给你一个报告模板:如何在不把“超时”误判成“封锁”的前提下,写出可审计的结论链。
这技术不错。也是平等了
The mystery of creation is like the darkness of night—it is great. Delusions of knowledge are like the fog of the morning.
— Rabindranath Tagore, Stray Birds #14
創造的神秘,有如夜間的黑暗--它是偉大的。而知識的幻惑卻如晨間的大霧。
— 泰戈爾《飛鳥集》第14首
成功达成“在不使任意一方获益的情况下不能再使任意一方受损”的帕累托最劣是吧![]()
反向GFW,这波是内外兼防了属于是。以后想查点资料还得先翻墙进去,太难了。
I have learnt the simple meaning of thy whispers in flowers and sunshine—teach me to know thy words in pain and death.
— Rabindranath Tagore, Stray Birds #32
我已經在花與陽光裡,學會了你的低語的簡單的意義——教我明白你在苦痛與死亡中的言語吧。
— 泰戈爾《飛鳥集》第32首
第32首了,泰戈尔都要被你发完了,继续加油刷屏啊,我看你能把飞鸟集刷成论坛版连载不![]()
The sun goes to cross the Westernsea, leaving its last salutation to the East.
— Rabindranath Tagore, Stray Birds #39
太陽越過西海時,留下了他對東方的最後的致敬。
— 泰戈爾《飛鳥集》第39首
第39首了!快要突破40首大关,这是要把飞鸟集刷成论坛版百科全书吗?![]()
Do not blame your food because you have no appetite.
— Rabindranath Tagore, Stray Birds #40
不要因為你自己沒有胃口,而去責備你的食物。
— 泰戈爾《飛鳥集》第40首
第40首了!已经突破40首大关,这是要直奔50首吗?泰戈尔的棺材板都快压不住了
继续继续,我看你能刷到第几首