bard99's recent timeline updates

bard99

V2EX member #588707, joined on 2022-07-20 18:48:45 +08:00

Today's activity rank 23448

bard99 提问技术话题好玩工作信息交易信息城市相关

Per bard99's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

bard99's recent replies

Nov 26, 2025

Replied to a topic by leonlly › macOS › M1 pro 内建触控板滑动卡顿

+1 easydict

Mar 15, 2025

Replied to a topic by bard99 › 软件 › 请教一下视频录制的右下角显示演讲者，是用的什么软件呢？想用

感谢大家，我都去试一试！后面考虑用一下～

Mar 7, 2025

Replied to a topic by Cyzc › 职场话题 › 同事离职送礼求推荐

乐高

Jan 20, 2025

Replied to a topic by bard99 › 分享发现 › excalidraw 手绘字体支持中文啦？！

@oott123 果然，原来有 blog ！👍

Aug 16, 2023

Replied to a topic by bard99 › Java › 有个思源宋体的字体使用疑惑，请大佬指点

@mw2c #15 @tabris17
我刚才做了几个实验，猜测找到了原因：

我使用 WPS 先生成 word ，再将 word 转成 PDF 。使用的是思源宋体：

然后使用 Python 脚本读取 PDF 内容和 Unicode 编码值：

发现 WPS 生成 PDF 的文字是正常的「 4e59 」编码！

对比之下，我之前使用 itext 生成的 PDF 。使用的是思源宋体：

使用 Python 脚本读取 PDF 内容和 Unicode 编码值：

这个 PDF 的文字是异常的「 2f04 」编码！

所以猜测可能就是 itext 的 bug：
1. 对于共用字型的字体，如：2f04 和 4e59 ，字型为「⼄」和「乙」。
2. itext 程序的 bug ，导致了在使用 html 生成 PDF 的过程中
3. 首先 html 文本传入的是 4e59 ，然后 itext 根据 4e59 找到了字体「乙-2f04/4e59 」
4. 然后写入生成 PDF 的过程中，使用了「乙」的字型，但错误的使用了 2f04 的 Unicode 编码！
a. 对于 WPS 来说没有这个问题，会使用 4e59 的 Unicode 编码。
5. 所以原因，还是 itext 的问题！ [至于具体的原因，还得 debug 去看了；看了半天没看出来逻辑在哪里...] ！
a. 初步推测，itext 根据 4e59 找到了字体「乙-2f04/4e59 」，然后写入 PDF 时写入了「乙-2f04 」，很可能就是获取了第一个 Unicode 编码值！而 WPS 可能是写入了「乙」，然后 Unicode 编码值则从原始文本获取，这样就关联正确了！

Aug 16, 2023

Replied to a topic by bard99 › Java › 有个思源宋体的字体使用疑惑，请大佬指点

@tabris17 #14 刚用 fontstore 试了狮尾四季春、SiHei 字体，发现他们都没有给 2F04 编码添加字型！所以这 2 个字体生成的 PDF ，文字都是正常的，都是 4E59 编码的「乙」！

Aug 16, 2023

Replied to a topic by bard99 › Java › 有个思源宋体的字体使用疑惑，请大佬指点

@mw2c 这 2 篇文字涨知识了，感谢。然后我本地试了一下 4 种正规化的结果，打印如下：