由于自己写博客,总有些词语不能碰,比如说公司相关的机密以及法律严禁的词语,因此自己写了个小的程序来查找特定目录下所有文件是否包含指定的中文或英文词语,有的话将对应的文件和行号输出。
下面的代码只是实现简单的功能,效率非常的差,因为嵌套了多层循环。但是没办法,python的语法和库不是很懂,只能按照写C的逻辑来实现功能了。
对中文字符的处理,必须使用UTF-8
的格式,否则有可能出现如下类似的错误:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc6 in position 18: invalid continuation byte
代码如下:
1 | #!/usr/bin/env python3 |