各位大佬好,问题如标题。
来源是本节点上周的一个帖子,讨论网页代理的:
https://www.v2ex.com/t/992044
我不太懂 web 相关的技术,但是看了觉得蛮有意思的,于是拿了回复中的几个方案试了一下,比如:
https://github.com/netptop/siteproxy
https://github.com/Hideipnetwork/hideipnetwork-web/tree/v3.1-beta
第一个方案可以直接部署在 cf worker 上,所以我先跑了这个,可以用。
问题来了,我接着拿了国内几个论坛网站试了试。却发现有的中文网站会出现乱码。比如 NGA 游戏论坛(nga.178.com)
查了一下,说这种乱码是编码解析的问题,比如论坛用的是 GBK ,可能是脚本没有正确解析。
于是我问 gpt 怎么解决,它告诉我一个方案,就是脚本要对于 gbk 编码进行处理,我问了解法之后,打算修改代码,却发现上面的 siteproxy 项目里面其实已经做过了: https://github.com/netptop/siteproxy/commit/e1f7d2c9b810919b7d29ea535cb55ac9fb46e1bb
这下我没辙了,上面提到的第二个方案也是乱码,难道是这个网站有什么特殊嘛?
web 小白,求解。
来源是本节点上周的一个帖子,讨论网页代理的:
https://www.v2ex.com/t/992044
我不太懂 web 相关的技术,但是看了觉得蛮有意思的,于是拿了回复中的几个方案试了一下,比如:
https://github.com/netptop/siteproxy
https://github.com/Hideipnetwork/hideipnetwork-web/tree/v3.1-beta
第一个方案可以直接部署在 cf worker 上,所以我先跑了这个,可以用。
问题来了,我接着拿了国内几个论坛网站试了试。却发现有的中文网站会出现乱码。比如 NGA 游戏论坛(nga.178.com)
查了一下,说这种乱码是编码解析的问题,比如论坛用的是 GBK ,可能是脚本没有正确解析。
于是我问 gpt 怎么解决,它告诉我一个方案,就是脚本要对于 gbk 编码进行处理,我问了解法之后,打算修改代码,却发现上面的 siteproxy 项目里面其实已经做过了: https://github.com/netptop/siteproxy/commit/e1f7d2c9b810919b7d29ea535cb55ac9fb46e1bb
这下我没辙了,上面提到的第二个方案也是乱码,难道是这个网站有什么特殊嘛?
web 小白,求解。