写了一个 test.php 脚本,文件编码为 UTF-8 ,代码如下:
<?php
$str = '你好';
var_dump($str);
在 windows cmd 命令行执行此脚本,正常输出“你好”。
我的疑问是,windows cmd 命令行的编码是 GBK ,而代码文件的编码是 UTF-8 ,两者的编码不一样,为什么输出中文没有乱码?
更诡异的是,我将代码文件的编码改为 GBK ,然后再执行,此时命令行、代码文件的编码都是 GBK ,反而乱码了。。。
我的环境是 Windows 10 ,PHP 7.4
1
hefish 2022-05-22 21:22:38 +08:00
说不定是 php7 for win 已经自己处理了这个问题。方便 cmd 下调试。
|
2
ji39 2022-05-22 21:36:59 +08:00
你找 Windows 7 试试看, 反过来的
|
3
rockyliang OP @ji39 卧槽,还真的是! win 10 和 win 7 的 cmd 居然还有这种差异....
|
4
jinliming2 2022-05-22 22:05:26 +08:00
好像从哪个版本开始,已经默认 unicode 了,打开老版本的迅雷 5 都是全软件除了贴图全部乱码的……
|
5
rockyliang OP @jinliming2 但我在 cmd 窗口顶部右键 -> 属性 -> 选项 -> 当前代码页,显示的是简体中文 GBK ,如果真的是改为 UTF-8 了,那它这里显示的编码就不正确了
|
6
rockyliang OP |
7
AoEiuV020CN 2022-05-22 23:22:28 +08:00 via Android
这种鬼问题也是开发不推荐用 Windows 的原因之一,
|
8
AngryPanda 2022-05-22 23:32:08 +08:00 via iPhone
不建议在 Windows 上折腾
|
9
ragnaroks 2022-05-23 00:31:31 +08:00 1
如果你是 php.exe test.php 这样执行的,那么实际上是由 php.exe 以 UTF8 读取了 test.php 并执行,这个问题我在 php 5.3 时代遇到过
|
10
encro 2022-05-23 09:14:38 +08:00
看看,PHP 多友好,哈哈。
|
11
sammeishi 2022-05-23 16:40:00 +08:00
你迷糊是因为你压根没搞清楚编码的逻辑。CMD 和这个编码无关他只是调用程序。编码涉及到 2 个点 A 文件保存编码 B 读取者什么编码读取。 你保存的 php 文件编码是 UTF8 ,而 php 默认也是 UTF8 读取执行的,那输出正常这有什么问题吗,CMD 在这里也只是个调用者输出也都是 php 给的。 反过来文件是 GBK ,php 还是 UTF8 读取那肯定乱了。你可以在 GBK 的 php 里改一下代码:var_dump(iconv("GBK","UTF-8",$str)) 这就正常了。
|
12
hho2002 2022-05-25 19:11:44 +08:00 1
php-7.1.1 版本修改
https://github.com/php/php-src/commit/e33ec61f9c1baa73bfe1b03b8c48a824ab2a867e https://www.php.net/manual/zh/migration71.windows-support.php The console output codepage is adjusted depending on the encoding used in PHP. Depending on the concrete system OEM codepage, the visible output might or might be not correct. For example, in the default cmd.exe and on a system with the OEM codepage 437, outputs in codepages 1251, 1252, 1253 and some others can be shown correctly when using UTF-8. On the same system, chars in codepage like 20932 probably won't be shown correctly. This refers to the particular system rules for codepage, font compatibility and the particular console program used. PHP automatically sets the console codepage according to the encoding rules from php.ini. Using alternative consoles instead of cmd.exe directly might bring better experience in some cases. |
13
hho2002 2022-05-25 19:16:32 +08:00 1
php.ini 中设置 output_encoding = "GBK" ,执行 GBK 编码文件,windows cmd 输出就正常了
|