当前位置:Gxlcms > Python > Python实现从序列中移除重复项且保持元素间顺序不变

Python实现从序列中移除重复项且保持元素间顺序不变

时间:2021-07-01 10:21:17 帮助过:239人阅读

本篇文章给大家带来的内容是关于Python实现从序列中移除重复项且保持元素间顺序不变,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

1、需求

我们想去除序列出现的重复元素,但仍然保持剩下的元素的顺序不变。

如果只是想要去重,那么通常足够简单的方法就是构建一个集合:

  1. a=[1,5,4,36,7,8,2,3,5,7]
  2. #
结果为:{1, 2, 3, 4, 5, 36, 7, 8} print(set(a))

2、解决方案

如果序列中的值是可哈希的(hashable),那么这个问题可以通过使用集合和生成器轻松解决。

如果一个对象是可哈希的,那么它的生存期内必须是不可变的,它需要有一个__hash__()方法。整数、浮点数、字符串、元素都是不可变的。
  1. def dedupe(items):
  2. seen=set()
  3. for item in items:
  4. if item not in seen:
  5. yield item
  6. seen.add(item)
  7. a=[1,2,3,1,9,1,5,10]
  8. print(list(dedupe(a)))

运行结果:

  1. [1, 2, 3, 9, 5, 10]

只有当序列中的元素是可哈希的时候才能这么做。如果想在不可哈希的对象序列中去除重复项,需要上述代码稍作修改:

  1. def dedupe(items,key=None):
  2. seen=set()
  3. for item in items:
  4. value=item if key is None else key(item)
  5. if value not in seen:
  6. yield item
  7. seen.add(value)
  8. a=[
  9. {'x':1,'y':2},
  10. {'x':1,'y':3},
  11. {'x':1,'y':4},
  12. {'x':1,'y':2},
  13. {'x':1,'y':3},
  14. {'x':1,'y':1},
  15. ]
  16. print(list(dedupe(a,key=lambda d:(d['x'],d['y']))))
  17. print(list(dedupe(a,key=lambda d:d['y'])))

运行结果:

  1. [{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 1, 'y': 4}, {'x': 1, 'y': 1}]
  2. [{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 1, 'y': 4}, {'x': 1, 'y': 1}]

这里的参数key的作用是指定一个函数用来将序列中的元素转换为可哈希的类型,那么做的目的是为了检测重复项。

以上就是Python实现从序列中移除重复项且保持元素间顺序不变的详细内容,更多请关注Gxl网其它相关文章!

人气教程排行