sakila

V2EX member #220510, joined on 2017-03-12 16:42:38 +08:00

sakila 提问技术话题好玩工作信息交易信息城市相关

Per sakila's settings, the topics list is hidden

Deals info, including closed deals, is not hidden

sakila's recent replies

Apr 8, 2020

Replied to a topic by xiao38245 › 程序员 › 三年爬虫需要什么技能树?

@scukmh 三年爬虫经验:
1. 熟练使用 python 编写爬虫两年
2. 坐牢一年
----
谢谢兄弟, 有被笑到

Apr 8, 2020

Replied to a topic by xiangyuecn › 程序员 › 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂

回复不能用 markdown?? 题主将就看吧

Apr 8, 2020

Replied to a topic by xiangyuecn › 程序员 › 正则 \s 不同语言的差异 \u0020 \u00A0 快来入坑吧😂

关于这个问题你可以看一下字符的类别, `unicodedata.category(unichr)`可以返回 str 的常规类别([general category]( https://en.wikipedia.org/wiki/Unicode_character_property)). 比如中文或一些外文的的声调符号的 category 是`Mn`.

`unicodedata.normalize(form, unistr)`可以返回 Unicode 字符串 unistr 的普通形式“form”, 有`NFC`, `NFKC`, `NFD`和`NFKD`等, 详细解释见[unicode equivalence]( https://en.wikipedia.org/wiki/Unicode_equivalence)

比如一段代码:

```python
>>> s = 'Ślusàrski'
>>> print(s)
'Ślusàrski'
```

现在是 NFC composition 形式, 也就是'Ś' = 'Ś'

转换成 NFD decomposition 形式:

```python
>>> print(ascii(unicodedata.normalize('NFD','Ślusàrski')))
'S\u0301lusa\u0300rski'
```

'Ś' = 'S\u0301'

因此可以写一个 unicode_to_ascii 的函数:

>>> s = 'Ślusàrski'
>>> def unicode_to_ascii(s):
>>> return ''.join(c for c in unicodedata.normalize('NFD', s)
>>> if unicodedata.category(c) != 'Mn')
>>> print(unicode_to_ascii(s))
Slusarski
```

不知道是否满足题主的问题

Apr 7, 2020

Replied to a topic by sakila › 分享发现 › 分享个好玩的，看 19 年哪个大学的学生在 github 提交最多

@jackchao7432 样本不合理，所以这是一个没有意义的统计
-------
确实不合理,确实意义小,看个乐呵就行

@qwertqwert12345 说样本不合理的人，可以想一想怎么才能囊括所有

我直接说：不可能
-------
同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

@telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
-------
我还真不知道有的高校不提供邮箱, 直觉不太可能吧
即使邮箱在中国高校不怎么常用, 不至于没有吧

@cht1995 想 cv 一下结果花了五分钟都没注册好 😔
-------
哈哈复现过程比较复杂, 代码的技术含量并不复杂

@Perry 很多学校自建 GitLab 或者 GitHub Enterprise，这些信息应该不是公开的？
-------
同意不过内网的东西谁也拿不到吧

@fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的，毕竟有免费的高级帐号可以用
-------
对比如我但是我校 laji 邮箱死活收不到 github 验证于是作罢

Mar 27, 2020

Replied to a topic by sakila › 分享发现 › 分享个好玩的，看 19 年哪个大学的学生在 github 提交最多

@fish267 对因为邮箱后缀是硬的标识

Oct 12, 2019

Replied to a topic by wanwushengzhang › 程序员 › 求助！总被刷票，大佬们给支支招？

@lscho 如果涉及到羊毛的话，加个短信验证码之类的提高刷票成本就行了。
----------------------------------------------------
加短信验证码会不会同时提高自己的成本呢

Aug 21, 2019

Replied to a topic by liualeng › 程序员 › 想问问各位程序员同学，大家平常工作使用什么记录笔记呢？

@sakila 用这俩纯粹因为电脑上装着，顺手。如果没装这俩我可能现在会用记事本

Aug 21, 2019

Replied to a topic by liualeng › 程序员 › 想问问各位程序员同学，大家平常工作使用什么记录笔记呢？

我觉得工具不是目的，关键是意识。千万不要陷入一个误区：如果我有了 XXX 工具，我就会 XXX
同理：如果我买了 XXX，我就会 XXX
记住：工具永远是是一个手段，而些什么才是重要的东西。
我一般用 notepad++或 vscode

» More replies by sakila