分享一个中文文案排版纠正器,原发于 https://laravel-china.org/articles/4532/chinese-copywriter
项目地址 https://github.com/ricoa/copywriting-correct
演示地址 https://copywriting-correct.ricoo.top
统一中文文案、排版的相关用法,降低团队成员之间的沟通成本,增强网站气质。
比较以下排版:
LeanCloud 数据存储是围绕 AVObject 进行的.每个 AVObject 都包含了与 JSON 兼容的 key-value 对应的数据。数据是 schema-free 的,你不需要在每个 AVObject 上提前指定存在哪些键,只要直接设定对应的 key-value 即可。 gitHub 是一个通过 git 进行版本控制的软件源代码托管服务,由 GitHub 公司(曾称 Logical Awesome )的开发者 Chris Wanstrath 、 PJ Hyett 和 Tom Preston-Werner 使用 Ruby on Rails 编写而成。
LeanCloud 数据存储是围绕 AVObject 进行的。每个 AVObject 都包含了与 JSON 兼容的 key-value 对应的数据。数据是 schema-free 的,你不需要在每个 AVObject 上提前指定存在哪些键,只要直接设定对应的 key-value 即可。 GitHub 是一个通过 Git 进行版本控制的软件源代码托管服务,由 GitHub 公司(曾称 Logical Awesome )的开发者 Chris Wanstrath 、 PJ Hyett 和 Tom Preston-Werner 使用 Ruby on Rails 编写而成。
很明显,第二种排版中英文有空格,标点符号也使用正确,专有名词使用正确,会让人看起来更舒服,也更专业。 本系统正是基于 中文文案排版指北(简体中文版) 进行纠正,帮助解决中英文混排的排版问题,提高文案可阅读性。
//安装开发中版本
composer require ricoa/copywriting-correct:dev-master
<?php
require_once 'vendor/autoload.php';
use Ricoa\CopyWritingCorrect\CopyWritingCorrectService;
$service=new CopyWritingCorrectService();
$text=$service->correct('在 LeanCloud 上,数据存储是围绕 AVObject 进行的。');
继承 \Ricoa\CopyWritingCorrect\Correctors\Corrector ,并实现 handle 方法。例如 ExampleCorrector.php
<?php
class ExampleCorrector extends \Ricoa\CopyWritingCorrect\Correctors\Corrector {
protected static $corrector=null;
/**
* @param string $text
*
* @return mixed
*/
public function handle($text)
{
return $text;
}
}
使用:
<?php
require_once 'vendor/autoload.php';
use Ricoa\CopyWritingCorrect\CopyWritingCorrectService;
$service=new CopyWritingCorrectService();
$service->addCorrectors([ExampleCorrector::class]);//注入纠正器
$service->resetCorrectors([ExampleCorrector::class]);//重置纠正器,也即废弃默认的纠正器
$text=$service->correct('在 LeanCloud 上,数据存储是围绕 AVObject 进行的。');
[
'0' , '1' , '2' , '3' , '4' ,
'5' , '6' , '7' , '8' , '9' ,
'A' , 'B' , 'C' , 'D' , 'E' ,
'F' , 'G' , 'H' , 'I' , 'J' ,
'K' , 'L' , 'M' , 'N' , 'O' ,
'P' , 'Q' , 'R' , 'S' , 'T' ,
'U' , 'V' , 'W' , 'X' , 'Y' ,
'Z' , 'a' , 'b' , 'c' , 'd' ,
'e' , 'f' , 'g' , 'h' , 'i' ,
'j' , 'k' , 'l' , 'm' , 'n' ,
'o' , 'p' , 'q' , 'r' , 's' ,
't' , 'u' , 'v' , 'w' , 'x' ,
'y' , 'z' , '-' , ' ' , '/' ,
'%' , '#' , '@' , '&' , '<' ,
'>' , '[' , ']' , '{' , '}' ,
'\' , '|' , '+' , '=' , '_' ,
'^' , ' ̄' , '`'
];
//转
[
'0', '1', '2', '3', '4',
'5', '6', '7', '8', '9',
'A', 'B', 'C', 'D', 'E',
'F', 'G', 'H', 'I', 'J',
'K', 'L', 'M', 'N', 'O',
'P', 'Q', 'R', 'S', 'T',
'U', 'V', 'W', 'X', 'Y',
'Z', 'a', 'b', 'c', 'd',
'e', 'f', 'g', 'h', 'i',
'j', 'k', 'l', 'm', 'n',
'o', 'p', 'q', 'r', 's',
't', 'u', 'v', 'w', 'x',
'y', 'z', '-', ' ', '/',
'%', '#', '@', '&', '<',
'>', '[', ']', '{', '}',
'\\','|', '+', '=', '_',
'^', '~', '`'
];
有什么新的想法和建议,欢迎提交 issue 或者 Pull Requests。
基于 MIT license.
1
neroxps 2017-04-26 16:47:31 +08:00
bug 反馈,括号后面的英文标点不会纠正成中文符号。
例如:(你好). 应该纠正成 (你好)。 另建议 ( abc ) 能够纠正成 (abc) 意思就是如果括号内容是中文,就用中文括号,如果是英文,就应该用英文括号。 小建议 XD |
2
geelaw 2017-04-26 16:49:46 +08:00 2
这个指北本身问题也很多,此外这个实现也有很多问题。
“在合适的位置添加空格”并不是正确的排版方式,而是一种因为现代浏览器不能正确排版而做的 hack 。那些位置应该具有的是 *空白* 而不是空格。如果你使用 Word 或 Outlook 就不会有这个问题。 另外看起来本文提到的 example 并不是最新的纠正器的结果:比如“。”和“ GitHub ”之间不需要空格,“ Awesome ”和“)”之间也不需要,“ Wanstrath ”、“、”和“ PJ ”之间也不需要。但是目前网页演示得到的结果是正确的。 汉字和拉丁字母之间插入空格的实现是错误的,例如“法语中两人初次见面可以用Énchanté(e)打招呼。”中第一个空格并未被加入。 数字和拉丁字母之间增加空格也不一定是正确的,例如 1Password 。 纠正拼写太激进,譬如 ruby 变 Ruby 和 window(s) 变 Windows 都不一定是正确的,还有 chef 、 grape 、 office 、 underscore 等词语也不应该自动纠正。以下词语是正确拼写: Vim 、 git (它可以是命令的名字)。 把 ie 替换为可能是错误的,它还可能是 i.e.。 拼写纠正器可能会意外地把 git-scm.org 纠正为非 canonical 的写法 Git-scm.org 。 另外双写、三连写“!”或“?”是正确用法。 |
3
byron 2017-04-26 17:13:27 +08:00
很好的产品,我本来想撸一个来着。
不过恕我眼拙,排版 1 和排版 2 我只看到了几个专有名词的区别, git-->Git 、 github-->GitHub 等。 |
4
byron 2017-04-26 17:16:50 +08:00
另外,建议把一些有争议的地方做成可选项。
比如最上面有开关,询问用户是习惯使用「直角引号」还是“弯引号”。 |
6
geelaw 2017-04-26 17:36:47 +08:00 via iPhone
@ynyounuo 我在其他帖子吐槽过这个智障设定,尤其是它的修正算法错得离谱。我个人也会使用空格代替空白的 hack ,而且很少写错
|
7
momocraft 2017-04-26 17:40:03 +08:00
很棒
我也在考虑做类似的东西 (不过不是 PHP),可能会模仿这个的一些功能。 |
9
vazo 2019-03-23 10:17:13 +08:00
楼主,你的演示网站已打不开
https://copywriting-correct.ricoo.top |