V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Pipecraft  ›  全部回复第 3 页 / 共 42 页
回复总数  822
1  2  3  4  5  6  7  8  9  10 ... 42  
233 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
@blueboyggh #17 如果长度要求不是 4 ,而是 8 , `{4,}` 改成 `{8,}` 即可。
`####` 是分割两个字符串的,可以换成其他任意字符串。
`[^,.,。]` 可以把其他要排除的标点符号加进去,比如 !?; 等。
正则表达式里的 `?=\1` 改成 `?:\1` 可能性能会更好一点。

后来想了想,有些情况,提取的不完整。
比如
str1 = "我今天特别开心啊,因为今天是个好日子,我中了 500 万彩票。"
str2 = "今天不是个好日子,因为邻居中了 500 万彩票,我今天不开心,我也想中 500 万彩票。"
只提取了 '是个好日子', '中了 500 万彩票'。
‘ 500 万彩票’ 没有提取出来。
要完整的提取,str1, str2 换个位置,再执行一次,然后两个结果取并集就完整了。

```python
import re

pattern = re.compile(r'([^,.,。]{4,})(?=.*####.*?(?:\1))')

def find_common_subsequences(str1, str2):
result1 = pattern.findall(str1 + "####" + str2)
result2 = pattern.findall(str2 + "####" + str1)
return list(set(result1).union(set(result2)))

# TEST
str1 = "我今天特别开心啊,因为今天是个好日子,我中了 500 万彩票。"
str2 = "今天不是个好日子,因为邻居中了 500 万彩票,我今天不开心,我也想中 500 万彩票。"
result = find_common_subsequences(str1, str2)
print(result)

# 输出: ['是个好日子', ' 500 万彩票', '中了 500 万彩票']
```
234 天前
回复了 blueboyggh 创建的主题 Python Python 如何提取两个字符串中的相同部分?
OP 想要的是提取所有长度大于 4 的公共子序列,而上面一些回复说的是最长公共子序列,两个是不同问题。

如果只是执行一次的任务,那可以怎么简单怎么来。
比如,利用正则表达式可以 1 行代码解决。

```python
import re

str1 = "我今天特别开心啊,因为今天是个好日子,我中了 500 万彩票。"
str2 = "今天不是个好日子,因为邻居中了 500 万彩票,我今天不开心。"

result = re.compile(r'([^,.,。]{4,})(?=.*####.*?(?=\1))').findall(str1 + "####" + str2)

print(result)
# 输出: ['是个好日子', '中了 500 万彩票']
```

正则的贪婪匹配,比较契合 OP 这个的问题。
共用的函数单独发布到 npm 。
各个浏览器扩展项目依赖这个共用模块。
用 esbuild 或 rollup 把源代码打包成 content.js 。
240 天前
回复了 lingyan190 创建的主题 程序员 求沉浸式翻译的代替品
翻译插件这种建议能用开源的就用开源的。

因为这个东西能在所有网站执行,读取网页所有内容,它与服务器有通信,不开源,看不到代码,不知道会做什么事情。作者一个人时,可能不会有问题,作者人好像还不错;现在是团队了,会变成什么样子不好说。

这个插件的油猴脚本 5 月 26 日之前还发布在 greasy fork, 没有混淆代码,之后版本就开始混淆代码,没有发布在 greasy fork 了。
240 天前
回复了 JuSH 创建的主题 分享发现 v2ex 的帖子回复楼层编号显示方式调整建议
OP 提到的问题很久以前开始多次有人提过了。
忍受不了错误的楼层号,我写了一个油猴脚本,能修复楼层号,及上面提到的所有问题。
油猴脚本安装地址: https://greasyfork.org/zh-CN/scripts/466589-v2ex-rep

- 修复有被 block 的用户时错位的楼层号
- 回复时自动带上楼层号
- 显示被引用的回复
- 以及更多功能

https://i.imgur.com/QAev5cE.png

https://i.imgur.com/EYb72Ov.png

https://i.imgur.com/FN7nmhH.png
首先打开这个脚本的“设置”选项,然后点击“导出数据/导入数据”

https://i.imgur.com/69ABf77.png

或者直接访问 https://utags.pipecraft.net/data/
周末带父母出去玩,散散心,拍拍照。如果父母平时发朋友圈,有旅游时的照片可发,也会很开心。
新增更换 favicon 图标为 GitHub 图标或用户头像的功能

https://i.imgur.com/FtcKzTT.gif
https://i.imgur.com/eGvfVIQ.png
站长随机到的头像太可爱了,片瀬沙里菜。
253 天前
回复了 lihexinkai 创建的主题 奇思妙想 大家帮忙看看这个点子怎么样
这个点子我觉得很不错,可行。
如果垃圾桶在楼下,人们顺手就扔了。可是如果要走一段时间,上班赶时间的时候,就会觉得很不方便。
有了这个服务,上班前放门口,下班回来没有了,就可以了。一周 1 元钱,完全没有负担。

我觉得还可以把去驿站取快递一起弄上,拉着小车先去取快递,然后挨家挨户边送快递,边收垃圾。

雇人方面,小区内就可以解决。我们这里,有很多在垃圾桶里找废纸熟料瓶子的老人,有时他们也上楼找废品。
可以雇这些老人,一个月给 2 ,3 千,我想会有很多愿意做的。
https://www.babelabc.com/ 这个网站练习听力很不错。作者(@weijar )也在 v2 。
253 天前
回复了 token10086 创建的主题 程序员 中午休息来换换友链
@MENGKE #29 已添加,你的博客很棒!
https://i.imgur.com/wrxjZMa.png
我安装了自动换头像的油猴脚本( https://www.v2ex.com/t/964080 ),楼主随机到的头像很漂亮。

建议线下认识,先从两点一线的生活走出来。
祝好运!
254 天前
回复了 token10086 创建的主题 程序员 中午休息来换换友链
@token10086 #8 是啊,经常来这里。我还做了很多 V2 周边用户脚本和网站呢 哈哈
https://tol.vip/ 和我的 https://discuss-cn.bestxtools.com/ 网站是同款 logo
254 天前
回复了 token10086 创建的主题 程序员 中午休息来换换友链
退出浏览器事件插件好像捕获不了,就算能捕获,如果浏览器被意外关闭,可能清除操作就不会执行。

可以换个思路,在浏览器启动时,执行清除操作。
使用 chrome.runtime.onStartup API 。
1  2  3  4  5  6  7  8  9  10 ... 42  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1133 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 18:41 · PVG 02:41 · LAX 11:41 · JFK 14:41
Developed with CodeLauncher
♥ Do have faith in what you're doing.