如果有两个格式不一样的 list, 怎么样判断是否含有“相同的单词”呢？ - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 4057 天前的主题，其中的信息可能已经有所发展或是发生改变。

第一个： [['Vodka'], ['Whisky'], ['Scotch'], ['Brandy']]
第二个： (['Vodka', 'today', 'nice', 'drink', 'Scotch'], 'Group 2')

11 条回复 • 2015-01-16 02:51:17 +08:00

1

aheadlead

2015 年 1 月 15 日

列表解析为set...交给set处理吧...

2

icedx

2015 年 1 月 15 日 via Android

for I in l1:
~for j in l2:

3

Fox4y

2015 年 1 月 15 日

a=[['Vodka'], ['Whisky'], ['Scotch'], ['Brandy']]
>>> for line in a:
... "Vodka" in line

4

ztcontrol

2015 年 1 月 15 日

外行，写的不对请指正
l1 = [['Vodka'], ['Whisky'], ['Scotch'], ['Brandy']]
l2 = (['Vodka', 'today', 'nice', 'drink', 'Scotch'], 'Group 2')

s1 = set()
s2 = set()

def listToSet(setx, listx):
for listobj in listx:
if type(listobj) == list:
listToSet(setx, listobj)
else:
setx.add(listobj)

listToSet(s1, l1)
listToSet(s2, l2)
print s1
print s2
print '/n'
print s1 & s2

5

thinkmore

2015 年 1 月 15 日

遍历

6

scenix

2015 年 1 月 15 日

递归试试？

#!/bin/env python
#encoding=utf-8
# Author: Aaron Shao - [email protected]
# Last modified: 2015-01-15 12:07
# Filename: test.py
# Description:

a= [['Vodka'], ['Whisky'], ['Scotch'], ['Brandy']]
b = (['Vodka', 'today', 'nice', 'drink', 'Scotch'], 'Group 2')

def parse(x):
if isinstance(x, (tuple,list)):
result = set([])
for i in x:
pass
result = result | parse(i)
return result
elif isinstance(x, str):
return set([x])
else:
return set([])

x = parse(a)
y = parse(b)

print x & y

7

scenix

2015 年 1 月 15 日

妈蛋忘了把email删了。。。

8

iannil

2015 年 1 月 15 日

1、看list1到list2的难度有多大。
2、如果去掉无效元素难度不大，就直接先把list1都处理成list2，或把list1和list2都处理成list3的格式。
3、如果去掉无效元素难度过大，就反过来处理，把list1和list2中你需要的信息拿出来，而不是去掉没用的信息。相同的单词这种特征简直太好取了。

9

hahastudio

2015 年 1 月 15 日

1

这时候就要祭出一个经典的 recipe 啦：
flatten arbitrarily nested lists
https://stackoverflow.com/questions/10823877/what-is-the-fastest-way-to-flatten-arbitrarily-nested-lists-in-python

交集就是
set(flatten(l1)).intersection(set(flatten(l2)))

10

imn1

2015 年 1 月 15 日

二维表一向都交由 pandas/numpy 处理，相关函数多得是

虽然处理这个问题用 pandas 有点托大，但估计这种数据的产生和后续处理也有不少地方可以用到 pandas

11

meteor2013

OP

2015 年 1 月 16 日

@hahastudio 谢谢啊，你这个方法超赞！！

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 694 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 28ms · UTC 22:32 · PVG 06:32 · LAX 14:32 · JFK 17:32
♥ Do have faith in what you're doing.